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Prefácio 


Quem imaginaria, na época em que a primeira edição de 
Análise Multivariada de Dados foi publicada há mais de 
25 anos, que o uso de estatística multivariada seria tão 
atraente quanto é hoje em dia? Durante esse período, 
vimos grandes mudanças no ambiente de pesquisa tanto 
acadêmica quanto aplicada. Em primeiro lugar, a revolu- 
ção do computador pessoal (PC) proporcionou poder de 
trabalho que era inimaginável até mesmo há poucos anos. 
Nesse trajeto, passamos dos cartões perfurados para o 
reconhecimento de voz, revolucionando a maneira como 
podemos interagir com o computador e usá-lo. Simulta- 
neamente vimos tremendos avanços na disponibilidade e 
na facilidade de uso de programas estatísticos, variando 
de pacotes computacionais completamente integrados — 
como o SPSS e o SAS — a programas especializados em 
técnicas como redes neurais e análise conjunta. Hoje, o 
pesquisador pode encontrar praticamente qualquer técni- 
ca concebível em um formato PC e a um preço razoável. 
No âmbito estatístico, temos presenciado um desen- 
volvimento contínuo de novas técnicas, como análise con- 
junta e modelagem de equações estruturais. Todos esses 
avanços, porém, têm sido acompanhados por uma necessi- 
dade crescente de maior capacidade analítica. A explosão 
de dados dos últimos anos tem pesado não somente sobre 
nossos recursos físicos para lidar e analisar toda a infor- 
mação disponível, mas tem exigido também uma reavalia- 
ção de nossa abordagem à análise de dados. Finalmente, 
a combinação da complexidade dos tópicos abordados e 
o crescente papel da teoria no planejamento de pesqui- 
sa está requerendo técnicas mais rigorosas e sofisticadas 
para executar as análises confirmatórias necessárias. 
Todos esses eventos têm contribuído para a aceitação 
das últimas cinco edições deste texto e para a demanda 
desta sexta edição. Ao promovermos esta revisão, tenta- 
mos contemplar pesquisadores tanto acadêmicos quanto 
aplicados, com uma apresentação fortemente fundamen- 


tada em técnicas estatísticas, mas focando planejamento, 
estimação e interpretação. Continuamente nos esforça- 
mos para diminuir nossa dependência de notação e termi- 
nologia estatística, e, para tal, identificamos os conceitos 
fundamentais que afetam nosso uso dessas técnicas e os 
expressamos em termos simples: uma introdução orien- 
tada a aplicações em análise multivariada para aqueles 
que não são estatísticos. Nosso compromisso ainda é for- 
necer uma firme compreensão dos princípios estatísticos 
e gerenciais inerentes à análise multivariada, de modo a 
desenvolver uma “área de conforto” não somente para 
as questões estatísticas envolvidas, mas também para os 
aspectos práticos. 


O QUE HÁ DE NOVO? 


A mudança mais evidente na sexta edição é a nova base 
de dados — HBAT. A ênfase em medida melhorada, par- 
ticularmente em construtos multiitem, nos levou a desen- 
volver a HBAT. Após substanciais testes, acreditamos 
que ela fornece uma ferramenta de ensino expandida com 
várias técnicas comparáveis às da base de dados HATCO. 
Outra mudança importante refere-se à inserção de “regras 
práticas” para a aplicação e interpretação das várias téc- 
nicas. Elas estão em destaque ao longo dos capítulos para 
facilitar seu uso. Estamos confiantes que essas orientações 
facilitarão o uso das técnicas. A terceira mudança impor- 
tante no texto é uma expansão substancial na cobertura 
de modelagem de equações estruturais. Agora temos três 
capítulos sobre essa técnica cada vez mais importante. O 
Capítulo 10 apresenta uma visão geral de modelagem de 
equações estruturais, o Capítulo 11 se concentra na análi- 
se fatorial confirmatória e o Capítulo 12 aborda questões 
sobre o teste de modelos estruturais. Esses três capítulos 
fornecem uma abrangente introdução a essa técnica. 
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O QUE FOI AMPLIADO 
E ATUALIZADO 


Todos os capítulos foram revisados para incorporar avan- 
ços tecnológicos, e diversos passaram por alterações signi- 
ficativas. O Capítulo 5, “ Análise discriminante múltipla e 
regressão logística”, fornece uma cobertura completa da 
análise de variáveis dependentes categóricas, incluindo 
a análise discriminante e a regressão logística. Uma dis- 
cussão ampliada de regressão logística inclui um exemplo 
ilustrativo usando a base de dados HBAT. O Capítulo 7, 
“Análise conjunta”, revisa aspectos do planejamento de 
pesquisa, concentrando-se no desenvolvimento dos estí- 
mulos conjuntos de maneira concisa e direta. Finalmente, 
os Capítulos 10 a 12, sobre modelagem de equações es- 
truturais, foram atualizados e ampliados para refletirem 
as inúmeras mudanças na área nos últimos anos. Cada 
capítulo contém também diversos tópicos expandidos e 
análises de exemplos, como o teste de modelos fatoriais 
de ordem superior, modelos de grupos e variáveis mode- 
radoras e mediadoras. 

Um importante desenvolvimento foi a criação de um 
site (www.prenhall.com/hair) dedicado à análise multi- 
variada, intitulado Great Ideas in Teaching Multivariate 
Statistics. Esse site (em inglês) atua como um centro de 
recursos para os interessados em análise multivariada, 
fornecendo links para recursos de cada técnica e um 
fórum para a identificação de novos tópicos ou méto- 
dos estatísticos. Desse modo, podemos fornecer mais 
prontamente um retorno a pesquisadores, em vez de 
eles terem que esperar por uma nova edição do livro. 
Também planejamos o site para que sirva como um am- 
biente para materiais de ensino em estatística multiva- 
riada — fornecendo exercícios, base de dados, e idéias 
de projetos. 

Todas essas mudanças, bem como outras não men- 
cionadas, ajudarão o leitor a compreender de forma 
mais completa os aspectos estatísticos e aplicados ine- 
rentes a essas técnicas. 
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CAPÍTULO 


Introdução 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


Explicar o que é análise multivariada e quando sua aplicação é adequada. 

Discutir a natureza das escalas de medida e sua relação com técnicas multivariadas. 
Compreender a natureza do erro de medida e seu impacto na análise multivariada. 
Determinar qual técnica multivariada é apropriada para um problema específico de pesquisa. 
Definir as técnicas específicas incluídas na análise multivariada. 

Discutir as orientações para a aplicação e interpretação da análise multivariada 
Compreender a abordagem em seis etapas para a construção de um modelo multivariado. 


Apresentação do capítulo 


O Capítulo 1 apresenta uma visão geral simplificada da análise multivariada. Enfatiza que os métodos 
de análise multivariada irão influenciar cada vez mais não apenas os aspectos analíticos de pesquisa, 
mas também o planejamento e a abordagem da coleta de dados para tomada de decisões e resolução 
de problemas. Apesar de as técnicas multivariadas terem muitas características em comum com suas 
contrapartes univariada e bivariada, várias diferenças importantes surgem na transição para uma aná- 
lise multivariada. Para ilustrar essa transição, este capítulo apresenta uma classificação das técnicas 
multivariadas. Em seguida, fornece linhas gerais para a aplicação dessas técnicas, bem como uma 
abordagem estruturada para a formulação, estimação e interpretação dos resultados multivariados. 
O capítulo conclui com uma discussão das bases de dados utilizadas ao longo do livro para ilustrar a 
aplicação das técnicas. 


Termos-chave Beta (b) Ver Erro Tipo ll. 

Bootstrapping Uma abordagem para validar um modelo mul- 
tivariado extraindo-se um grande número de sub-amostras e 
estimando modelos para cada uma delas. Estimativas a par- 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 


pontos que merecem destaque e as referências cruzadas nos tir de todas ao AuprEmpsna cao combinadas ii seguida, 
termos-chave estão em itálico. Exemplos ilustrativos apare- Fone acndo Rea penas do melherea coribicnSa estimados 
cem em quadros. (por exemplo, médias de cada coeficiente estimado ao longo 
de todos os modelos das sub-amostras), mas também sua 

Alfa (a) Ver Erro Tipo |. variabilidade esperada e, assim, sua probabilidade de dife- 
Análise multivariada nálise de múltiplas variáveis em um único renciar do zero; ou seja, os coeficientes estimados são esta- 
relacionamento ou conjunto de relações. tisticamente diferentes de zero ou não? Essa abordagem não 
Análise univariada de variância (ANOVA) écnica estatística depende de suposições estatísticas sobre a população para 


avaliar significância estatística, mas, ao invés disso, faz sua 


para determinar, com base em uma medida dependente, se 
“amostras são oriundas de populações com médias iguais. avaliação baseada somente nos dados amostrais. 
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Confiabilidade Extensão em que uma variável ou um conjunto 
de variáveis é consistente com o que se pretende medir. Se 
medidas repetidas forem executadas, as medidas confiáveis 
serão consistentes em seus valores. É diferente de validade, 
por se referir não ao que deveria ser medido, mas ao modo 
como é medido. 

Correlação parcial bivariada Correlação simples (duas variá- 
veis) entre dois conjuntos de resíduos (variâncias não expli- 
cadas) que permanecem depois que a associação de outras 
variáveis independentes é removida. 

Dados métricos Também chamados de dados quantitativos, 
dados intervalares ou dados proporcionais, essas medidas 
identificam ou descrevem indivíduos (ou objetos) não ape- 
nas pela posse de um atributo, mas também pela quantia 
ou grau em que o indivíduo pode ser caracterizado pelo atri- 
buto. Por exemplo, a idade ou o peso de alguém são dados 
métricos. 

Dados não-métricos Também chamados de dados qualitativos, 
são atributos, características ou propriedades categóricas 
que identificam ou descrevem um indivíduo ou objeto. Dife- 
rem dos dados métricos no sentido de indicarem a presença 
de um atributo, mas não a quantia. Exemplos são ocupações 
(médico, advogado, professor) ou status do comprador (com- 
prador, não-comprador). São também conhecidos como da- 
dos nominais ou dados ordinais. 

Erro de especificação Omissão de uma variável-chave da aná- 
lise, que causa um impacto sobre os efeitos estimados de va- 
riáveis incluídas. 

Erro de medida Imprecisão na mensuração dos valores “verda- 
deiros” das variáveis devido à falibilidade do instrumento de 
medida (ou seja, escalas de respostas inapropriadas), erros 
na entrada de dados, ou enganos dos respondentes. 

Erro Tipo | Probabilidade de rejeitar incorretamente a hipótese 
nula — na maioria dos casos, isso significa dizer que existe 
uma diferença ou correlação quando, na verdade, não é o 
caso. Também chamado de alfa (a). Níveis comuns são 5% 
ou 1%, chamados de níveis 0,05 ou 0,01, respectivamente. 

Erro Tipo Il Probabilidade de falhar incorretamente na rejeição 
da hipótese nula — em termos simples, a probabilidade de não 
encontrar uma correlação ou diferença na média quando ela 
existe. Também chamado de beta (B), está inversamente re- 
lacionado ao erro Tipo |. O valor 1 menos o erro Tipo II (1-B) é 
definido como poder. 

Escalas múltiplas Método de combinação de diversas variá- 
veis que medem o mesmo conceito em uma única variável 
como tentativa de aumentar a confiabilidade da medida por 
meio de medida multivariada. Na maioria dos exemplos, as 
variáveis separadas são somadas, e em seguida seu escore 
total ou médio é usado na análise. 

Indicador Variável única utilizada em conjunção com uma ou 
mais variáveis diferentes para formar uma medida composta. 

Medida composta Ver Escala múltipla. 

Medida multivariada Uso de duas ou mais variáveis como in- 
dicadores de uma única medida composta. Por exemplo, um 
teste de personalidade pode fornecer as respostas a diversas 
questões individuais (indicadores), as quais são então com- 


binadas para formar um escore único (escala múltipla), que 
representa o tipo de personalidade. 
Multicolinearidade Extensão em que uma variável pode ser 
explicada pelas outras variáveis na análise. À medida que 
a multicolinearidade aumenta, fica mais complicada a inter- 
pretação da variável estatística, uma vez que se torna mais 
difícil verificar o efeito de qualquer variável, devido a suas 
inter-relações. 
Poder Probabilidade de rejeitar corretamente a hipótese nula 
quando a mesma é falsa, ou seja, de encontrar corretamente um 
suposto relacionamento quando ele existe. Determinado como 
u 
p 


ma função (1) do nível de significância estatística dado pelo 

esquisador para um erro Tipo 1(o), (2) do tamanho da amostra 

ilizada na análise, e (3) do tamanho do efeito examinado. 

Significância prática Método de avaliar resultados da análise 

multivariada baseado em suas descobertas substanciais, em 
vez de sua significância estatística. Enquanto a significância 
estatística determina se o resultado pode ser atribuído ao 
acaso, a significância prática avalia se o resultado é útil (isto 
é, substancial o bastante para garantir ação) para atingir os 
objetivos da pesquisa. 

Tamanho do efeito Estimativa do grau em que o fenômeno es- 
tudado (por exemplo, correlação ou diferença em médias) 
existe na população. 

Técnica de dependência Classificação de técnicas estatísticas 
diferenciadas por terem uma variável ou um conjunto de va- 
riáveis identificado como a(s) variável(eis) dependente(s), e 
a(s) variável(eis) remanescente(s) como independente(s). O 
objetivo é a previsão da(s) variável(eis) dependente(s) pela(s) 
variável(eis) independente(s). Um exemplo é a análise de re- 
gressão. 

Técnica de interdependência Classificação de técnicas esta- 
tísticas nas quais as variáveis não são divididas em conjuntos 
dependentes e independentes; ou seja, todas as variáveis 
são analisadas como um único conjunto (por exemplo, análise 
fatorial). 

Tratamento Variável independente que o pesquisador ma- 
nipula para ver o efeito (se houver) sobre a(s) variável(eis) 
dependente(s), como em um experimento (por exemplo, o 
teste do apelo de anúncios coloridos versus preto-e-branco). 

Validade Extensão em que uma medida ou um conjunto de me- 
didas representa corretamente o conceito do estudo — o grau 
em que se está livre de qualquer erro sistemático ou não-ale- 
atório. A validade se refere a quão bem o conceito é definido 
pela(s) medida(s), enquanto confiabilidade se refere à consis- 
tência da(s) medida(s). 

Variável dependente Efeito presumido, ou resposta, a uma mu- 
dança na(s) variável(eis) independente (s). 

Variável dicotômica Variável não-métrica transformada em uma 
variável métrica designando-se 1 ou O a um objeto, depen- 
dendo se este possui ou não uma característica particular. 

Variável estatística Combinação linear de variáveis formada na 
técnica multivariada determinando-se pesos empíricos aplica- 
dos a um conjunto de variáveis especificado pelo pesquisador. 

Variável independente Causa presumida de qualquer mudan- 
ça na variável dependente. 


[em 
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O QUE É ANÁLISE MULTIVARIADA? 


Hoje em dia negócios devem ser mais lucrativos, reagir 
mais rapidamente e oferecer produtos e serviços de maior 
qualidade, e ainda fazer tudo isso com menos pessoas e a 
um menor custo. Uma exigência essencial nesse proces- 
so é a criação e o gerenciamento de conhecimento eficaz. 
Não há falta de informação, mas escassez de conhecimen- 
to. Como disse Tom Peters em seu livro Thriving on Cha- 
os, “Estamos nos afogando em informações e famintos 
por conhecimento” [7]. 

A informação disponível na tomada de decisões ex- 
plodiu nos últimos anos e irá continuar assim no futuro, 
provavelmente até mais rapidamente. Até recentemente, 
muito dessa informação simplesmente desaparecia. Ou 
não era coletada, ou era descartada. Hoje, essa informa- 
ção está sendo coletada e armazenada em bancos de da- 
dos e está disponível para ser feita a “garimpagem” para 
fins de melhoria na tomada de decisões. Parte dessa infor- 
mação pode ser analisada e compreendida com estatística 
simples, mas uma grande porção demanda técnicas esta- 
tísticas multivariadas mais complexas para converter tais 
dados em conhecimento. 

Diversos avanços tecnológicos nos ajudam a aplicar 
técnicas multivariadas. Entre os mais importantes estão 
os desenvolvimentos de hardware e software. A veloci- 
dade e o custo de equipamento computacional têm do- 
brado a cada 18 meses, enquanto os preços despencam. 
Pacotes computacionais amigáveis trouxeram a análise de 
dados para a era do aponte-e-clique, e podemos rapida- 
mente analisar montanhas de dados complexos com rela- 
tiva facilidade. De fato, a indústria, governos e centros de 
pesquisa ligados a universidades por todo o mundo estão 
fazendo amplo uso dessas técnicas. 

Ao longo do texto, usamos o termo genérico pesquisa- 
dor quando nos referimos a um analista de dados no âm- 
bito das comunidades acadêmica ou profissional. Acha- 
mos inadequado fazer qualquer distinção entre essas duas 
áreas, pois a pesquisa em ambas se sustenta em bases tan- 
to teóricas quanto quantitativas. A despeito dos objetivos 
da pesquisa e a ênfase em interpretação poderem variar, 
um pesquisador de qualquer área deve abordar todas as 
questões conceituais e empíricas levantadas nas discus- 
sões dos métodos estatísticos. 


ANÁLISE MULTIVARIADA EM 
TERMOS ESTATÍSTICOS 


Técnicas de análise multivariada são populares porque 
elas permitem que organizações criem conhecimento, me- 
lhorando assim suas tomadas de decisões. Análise multi- 
variada se refere a todas as técnicas estatísticas que simul- 
taneamente analisam múltiplas medidas sobre indivíduos 
ou objetos sob investigação. Assim, qualquer análise si- 


multânea de mais do que duas variáveis pode ser conside- 
rada, a princípio, como multivariada. 

Muitas técnicas multivariadas são extensões da análise 
univariada (análises de distribuições de uma única variá- 
vel) e da análise bivariada (classificação cruzada, correla- 
ção, análise de variância, e regressão simples usadas para 
analisar duas variáveis). Por exemplo, regressão simples 
(com uma variável preditora) é estendida no caso multiva- 
riado para incluir diversas variáveis preditoras. Analoga- 
mente, a variável dependente única encontrada na análise 
de variância é estendida para incluir múltiplas variáveis de- 
pendentes em análise multivariada de variância. Algumas 
técnicas multivariadas (por exemplo, regressão múltipla 
ou análise multivariada de variância) fornecem um meio 
de executar em uma única análise aquilo que antes exigia 
múltiplas análises univariadas para ser realizado. Outras 
técnicas multivariadas, não obstante, são exclusivamente 
planejadas para lidar com aspectos multivariados, como a 
análise fatorial, que identifica a estrutura inerente a um 
conjunto de variáveis, ou a análise discriminante, que dis- 
tingue entre grupos baseada em um conjunto de variáveis. 

Às vezes ocorrem confusões sobre o que é análise 
multivariada porque o termo não é empregado consisten- 
temente na literatura. Alguns pesquisadores usam multi- 
variada simplesmente para se referirem ao exame de rela- 
ções entre mais de duas variáveis. Outros utilizam o termo 
para problemas nos quais todas as múltiplas variáveis são 
assumidas como tendo uma distribuição normal multi- 
variada. 
multivariada, todas as variáveis devem ser aleatórias e 
inter-relacionadas de tal maneira que seus diferentes efei- 
tos não podem ser significativamente interpretados em 
separado. Alguns autores estabelecem que o objetivo da 


ara os propósitos deste livro, não insistimos 
em uma definição rígida para análise multivariada. No 
lugar disso, a análise multivariada incluirá tanto técnicas 
com muitas variáveis quanto técnicas verdadeiramente 
multivariadas, pois acreditamos que o conhecimento de 
técnicas com muitas variáveis é um primeiro passo essen- 
cial no entendimento da análise multivariada. 


ALGUNS CONCEITOS BÁSICOS 
DE ANALISE MULTIVARIADA 


Apesar de a análise multivariada ter suas raízes nas estatís- 
ticas univariada e bivariada, a extensão para o domínio mul- 
tivariado introduz conceitos adicionais e questões que têm 
particular relevância. Esses conceitos variam da necessida- 
de de uma compreensão conceitual do constructo da análise 
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multivariada — a variável estatística — até pontos específicos 
que lidam com os tipos de escalas de medida empregadas e 
as questões estatísticas de testes de significância e níveis de 
confiança. Cada conceito tem um papel significativo na apli- 
cação bem-sucedida de qualquer técnica multivariada. 


A variável estatística 


Como anteriormente mencionado, o constructo da análi- 
se multivariada é a variável estatística, uma combinação 
linear de variáveis com pesos empiricamente determina- 
dos. As variáveis são especificadas pelo pesquisador, sen- 
do os pesos determinados pela técnica multivariada para 
atingir um objetivo específico. Uma variável estatística de 
n variáveis ponderadas (X, até X,) pode ser enunciada 
matematicamente como: 


Valor da variável estatística = w X, + w,X, + w,;X, +: +w X, 


onde X, é a variável observada e w, é o peso determinado 
pela técnica multivariada. 

O resultado é um único valor que representa uma com- 
binação do conjunto inteiro de variáveis que melhor atinge 
o objetivo da análise multivariada específica. Em regres- 
são múltipla, a variável estatística é determinada de modo 
a maximizar a correlação entre as variáveis independentes 
múltiplas e a única variável dependente. Em análise dis- 
criminante, a variável estatística é formada de maneira a 
criar escores para cada observação que diferencie de for- 
ma máxima entre grupos de observações. Em análise fato- 
rial, variáveis estatísticas são formadas para melhor repre- 
sentarem a estrutura subjacente ou padrões das variáveis 
conforme representadas por suas intercorrelações. 

Em cada caso, a variável estatística captura o caráter 
multivariado da análise. Assim, em nossa discussão de 
cada técnica, a variável estatística é o ponto focal da aná- 
lise em muitos aspectos. Devemos compreender não ape- 
nas seu impacto coletivo em satisfazer o objetivo da técni- 
ca, mas também a contribuição de cada variável separada 
para o efeito geral da variável estatística. 


Escalas de medida 


A análise de dados envolve a identificação e a medida 
de variação em um conjunto de variáveis, seja entre elas 
mesmas ou entre uma variável dependente e uma ou mais 
variáveis independentes. A palavra-chave aqui é medida, 
pois o pesquisador não pode identificar variação a menos 
que ela possa ser medida. A mensuração é importante para 
representar com precisão o conceito de interesse, e é ins- 
trumental na seleção do método multivariado apropriado 
para análise. Dados podem ser classificados em uma entre 
duas categorias — não-métricos (qualitativos) e métricos 
(quantitativos) — baseadas no tipo de atributos ou caracte- 
rísticas que os dados representam. É importante observar 
que é responsabilidade do pesquisador definir o tipo de 
medida para cada variável. Para o computador, os valores 


são apenas números, mas, como perceberemos na próxima 
seção, definir dados como métricos ou não-métricos tem 
substancial impacto sobre o que os dados podem represen- 
tar e como eles podem ser analisados. 


Escalas de medida não-métrica 


Medidas que descrevem diferenças em tipo ou natureza, 


“propriedade, são chamadas de dados não-métricos. Essas 


propriedades são discretas no sentido de que, tendo uma 
característica particular, todas as demais características 
são excluídas; por exemplo, se uma pessoa é do sexo mas- 
culino, não pode ser do sexo feminino. Uma “quantia” 
de sexo não é viável, mas apenas o estado de ser do sexo 
masculino ou feminino. Medidas não-métricas podem ser 
feitas com uma escala nominal ou ordinal. 


Escalas nominais. Uma escala nominal designa números 

para rotular ou identificar indivíduos ou objetos. Os nú- 
meros designados aos objetos não têm significado quanti- 
tativo além da indicação da presença ou ausência do atri- 
buto ou característica sob investigação. Portanto, escalas 
nominais, também conhecidas como escalas categóricas, 
só podem fornecer o número de ocorrências em cada clas- 
se ou categoria da variável sob estudo. 


Por exemplo, ao representar sexo (masculino ou femini- 
no), o pesquisador pode designar números para cada ca- 
tegoria (por exemplo, 2 para mulheres e 1 para homens). 
Com esses valores, contudo, podemos apenas tabular o 
número de homens e de mulheres; carece de sentido o 
cálculo de valor médio de sexo. 


Dados nominais representam somente categorias ou 
classes, e não implicam quantias de um atributo ou ca- 
racterística. Exemplos frequentemente usados de dados 
nominalmente escalonados incluem diversos atributos de- 
mográficos (como sexo, religião, ocupação ou filiação par- 
tidária), muitas formas de comportamento (como com- 
portamento de voto ou atividade de compra), ou qualquer 
outra ação que seja discreta (que acontece ou não). 


Escalas ordinais. Escalas ordinais são o próximo nível 
“superior” de precisão em medida. No caso de escalas or- 
dinais, variáveis podem ser ordenadas ou ranqueadas em 
relação à quantia do atributo possuída. Todo indivíduo ou 
objeto pode ser comparado com outro em termos de uma 
relação da forma “maior que” ou “menor que”. Os nú- 
meros empregados em escalas ordinais, contudo, são real- 
mente não-quantitativos porque eles indicam apenas po- 
sições relativas em uma série ordenada. Escalas ordinais 
não fornecem qualquer medida da quantia ou magnitude 
real em termos absolutos, mas apenas a ordem dos valo- 
res. O pesquisador conhece a ordem, mas não a quantia 
de diferença entre os valores. 
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Por exemplo, diferentes níveis de satisfação de um con- 
sumidor em relação a diversos novos produtos podem 
ser ilustrados primeiramente usando-se uma escala or- 
dinal. A escala a seguir mostra a opinião de um respon- 
dente sobre três produtos. 


Produto A | Produto B 


Produto C 


Muito satisfeito Nada satisfeito 


Quando medimos essa variável com uma escala or- 
dinal, “ranqueamos a ordem” dos produtos baseados no 
nível de satisfação. Queremos uma medida que reflita 
que o respondente está mais satisfeito com o produto A 
do que com o produto B e mais satisfeito com o produto 
B do que com o produto €, baseados apenas em suas po- 
sições na escala. Poderíamos designar valores de “ordem 
de ranqueamento” (1 = mais satisfeito, 2 = o próximo 
mais satisfeito etc.) de 1 para o produto A (maior satis- 
fação), 2 para o produto B, e 3 para o produto €C. 

Quando vistos como dados ordinais, sabemos que o 
produto A tem a maior satisfação, seguido pelo produto 
B e então pelo produto €C. No entanto, não podemos fa- 
zer qualquer declaração quantitativa sobre as diferenças 
entre produtos (p. ex., não podemos responder se a dife- 
rença entre produtos A e B é maior do que a diferença 
entre os produtos B e C). Temos que usar uma escala 
intervalar (ver próxima seção) para avaliar qual é a mag- 
nitude de diferenças entre produtos. 


Em muitos casos, um pesquisador pode achar atraente 
o uso de medidas ordinais, mas as implicações sobre os ti- 
pos de análises que podem ser executadas são substanciais. 
O analista não pode realizar nenhuma operação aritméti- 
ca (somas, médias, multiplicações, divisões etc.), tornan- 
do assim todos os dados não-métricos bastante limitados 
em seu uso na estimação de coeficientes do modelo. Por 
esse motivo, muitas técnicas multivariadas são desenvol- 
vidas apenas para lidar com dados não-métricos (p. ex., 
análise de correspondência) ou para empregar dados não- 
métricos como uma variável independente* (p. ex., análise 
discriminante com uma variável dependente não-métrica, 
ou análise multivariada de variância com variáveis inde- 
pendentes não-métricas). Logo, o analista deve identificar 
todos os dados não-métricos para garantir que eles sejam 
utilizados adequadamente nas técnicas multivariadas. 


Escalas de medida métrica 

Em contraste com dados não-métricos, dados métricos 
são utilizados quando indivíduos diferem em quantia ou 
grau em relação a um atributo em particular. Variáveis 


*N. de R.T.: A frase certa seria “como uma variável dependente ou 
independente”. 


metricamente medidas refletem quantidade ou grau rela- 
tivo e são apropriadas para atributos envolvendo quantia 
ou magnitude, como o nível de satisfação ou compromisso 
com um emprego. As duas escalas de medida métrica são 
as escalas intervalares e de razão. 


Escalas intervalares. As escalas intervalares e escalas 
de razão (ambas métricas) fornecem o mais alto nível de 
precisão de medida, permitindo que quase todas as ope- 
rações matemáticas sejam executadas. Essas duas escalas 
têm unidades constantes de medida, e, portanto, diferen- 
ças entre quaisquer dois pontos adjacentes em qualquer 
parte da escala são iguais. 


No exemplo anterior de medida de satisfação, dados mé- 
tricos poderiam ser obtidos medindo-se a distância de um 
extremo da escala até a posição de cada produto. Consi- 
dere que o produto A estava a 2,5 unidades do extremo 
esquerdo, que o produto B estava a 6,0 unidades, e que 
o produto C estava a 12 unidades. Usando esses valores 
como medida de satisfação, poderíamos não apenas fazer 
as mesmas declarações que fizemos com os dados ordi- 
nais (p. ex., a ordem de ranqueamento dos produtos), mas 
poderíamos também perceber que a diferença entre os 
produtos A e B era muito menor (6,0 -2,5=3,5) do que a 
diferença entre os produtos B e € (12,0 — 6,0 = 6,0). 


A única diferença real entre escalas intervalares e es- 
calas de razão é que as primeiras têm um ponto zero arbi- 
trário, enquanto as escalas de razão incluem um ponto de 
zero absoluto. As escalas intervalares mais familiares são 
as escalas de temperatura Fahrenheit e Celsius. Cada uma 
tem um ponto zero arbitrário diferente, e nenhuma indica 
uma quantia nula ou ausência de temperatura, já que pode- 
mos registrar temperaturas abaixo do ponto zero em ambas. 
Logo, não é possível dizer que qualquer valor em uma esca- 
la intervalar é um múltiplo de algum outro ponto da escala. 


Por exemplo, não se pode considerar que um dia de 80ºF 
tem o dobro de temperatura de um dia de 40ºF, pois sa- 
bemos que 80ºF, em uma escala diferente, como Celsius, 
é 26,7ºC. Do mesmo modo, 40ºF em Celsius é 4,4ºC. 
Apesar de 80ºF ser de fato o dobro de 40ºF, não pode- 
mos afirmar que o calor de 80ºF é o dobro do calor de 
40ºF, já que, usando diferentes escalas, o calor não tem o 
dobro da intensidade, isto é, 4400 x 2 %26,7ºC. 


Escalas de razão. As escalas de razão representam a mais 
elevada forma de precisão de medida, pois possuem as van- 


tagens de todas as escalas inferiores somadas à existência de 
um ponto zero absoluto. Todas as operações matemáticas 
“são possíveis com medidas de escala de razão. As balanças 


de banheiros ou outros aparelhos comuns para medir pesos 
são exemplos dessas escalas, pois têm um ponto zero abso- 
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luto, e assim podemos falar em termos de múltiplos quando 
relacionamos um ponto da escala com outro; por exemplo, 
100 libras é duas vezes o peso de 50 libras. 


O impacto na escolha da escala de medida 
Compreender os diferentes tipos de escalas de medida é 
importante por duas razões. 


1. O pesquisador deve identificar a escala de medida de cada 
variável usada, de forma que dados não-métricos não sejam 
incorretamente usados como dados métricos e vice-versa 
(como em nosso exemplo anterior de representação de sexo 
como 1 para homem e 2 para mulher). Se o pesquisador in- 
corretamente define essa medida como métrica, então ela 
pode ser empregada inadequadamente (p. ex., encontrar o 
valor médio de sexo). 

2. A escala de medida é também crítica ao determinar quais 
técnicas multivariadas são as mais aplicáveis aos dados, com 
considerações feitas tanto para as variáveis independentes 
quanto para as dependentes. Na discussão sobre as técni- 
cas e sua classificação em seções apresentadas mais adiante 
neste capítulo, as propriedades métricas e não-métricas de 
variáveis independentes e dependentes são os fatores deter- 
minantes na escolha da técnica apropriada. 


Erro de medida e medida multivariada 


O uso de variáveis múltiplas e a confiança em sua com- 
binação (a variável estatística) em técnicas multivariadas 
também concentra a atenção em uma questão comple- 
mentar — o erro de medida. Erro de medida é o grau em 
que os valores observados não são representativos dos va- 
lores “verdadeiros”. Há muitas fontes para erros de medi- 
da, que variam desde os erros na entrada de dados devido 
à imprecisão da medida (p. ex., impor escalas com sete 
pontos para medida de atitude quando o pesquisador sabe 
que os respondentes podem responder precisamente ape- 
nas em escalas de três pontos) até a falta de habilidade dos 
respondentes em fornecerem informações precisas (p. ex., 
respostas como a renda familiar podem ser razoavelmente 
corretas, mas raramente exatas). Assim, todas as variáveis 
usadas em técnicas multivariadas devem ser consideradas 
como tendo um certo grau de erro de medida. O erro de 
medida acrescenta “ruído” às variáveis observadas ou me- 
didas. Logo, o valor observado obtido representa tanto o 
nível “verdadeiro” quanto o “ruído”. Quando usado para 
computar correlações ou médias, o efeito “verdadeiro” é 
parcialmente mascarado pelo erro de medida, causando 
um enfraquecimento nas correlações e menor precisão 
nas médias. O impacto específico de erro de medida e sua 
acomodação em relacionamentos de dependência é abor- 
dado mais detalhadamente no Capítulo 10. 


Validade e confiabilidade 

O objetivo do pesquisador de reduzir o erro de medida 
pode seguir diversos caminhos. Ao avaliar o grau de erro 
presente em qualquer medida, o pesquisador deve levar em 
conta duas importantes características de uma medida: 


e Validade é o grau em que uma medida representa preci- 
samente aquilo que se espera. Por exemplo, se queremos 
medir renda discricionária, não devemos perguntar a ren- 
da familiar total. A garantia da validade começa com uma 
compreensão direta do que deve ser medido e então realizar 
a medida tão “correta” e precisa quanto possível. No entan- 
to, valores exatos não garantem validade. Em nosso exem- 
plo de renda, o pesquisador poderia definir com grande 
exatidão o que é renda familiar, mas ainda ter uma medida 
“errada” (isto é, inválida) de renda discricionária, porque a 
pergunta “correta” não foi formulada. 

e Sea validade está garantida, o pesquisador deve ainda consi- 
derar a confiabilidade das medidas. Confiabilidade é o grau 
em que a variável observada mede o valor “verdadeiro” e 
está “livre de erro”; assim, é o oposto de erro de medida. 
Se a mesma medida for feita repetidamente, por exemplo, 
medidas mais confiáveis mostrarão maior consistência do 
que medidas menos confiáveis. O pesquisador sempre deve 
avaliar as variáveis empregadas e, se medidas alternativas 
válidas estão disponíveis, escolher a variável com a maior 
confiabilidade. 


Emprego de medida multivariada 

Além de reduzir o erro de medida melhorando variáveis 
individuais, o pesquisador pode também escolher o de- 
senvolvimento de medidas multivariadas, também conhe- 
cidas como escalas múltiplas, nas quais diversas variáveis 
são reunidas em uma medida composta para representar 
um conceito (p. ex., escalas de personalidade com múlti- 
plos itens, ou escalas múltiplas de satisfação com um pro- 
duto). O objetivo é evitar o uso de apenas uma variável 
para representar um conceito e, ao invés disso, usar várias 
variáveis como indicadores, todos representando diferen- 
tes facetas do conceito para se obter uma perspectiva mais 
“ampla”. O uso de múltiplos indicadores permite ao pes- 
quisador especificar mais precisamente as respostas dese- 
jadas. Não deposita total confiança em uma única respos- 
ta, mas na resposta “média” ou “típica” de um conjunto 
de respostas relacionadas. 


Por exemplo, ao medir satisfação, poder-se-ia perguntar 
simplesmente “Quão satisfeito você está?” e basear a 
análise nesta única resposta. Ou uma escala múltipla po- 
deria ser desenvolvida combinando várias respostas de 
satisfação (p. ex., achar o escore médio entre três medi- 
das — satisfação geral, a possibilidade de recomendação, 
e a probabilidade de novamente comprar). As diferentes 
medidas podem estar em diferentes formatos de respos- 
ta ou em diferentes áreas de interesse assumidas como 
abrangendo satisfação geral. 


A premissa guia é que respostas múltiplas refletem a 
resposta “verdadeira” com maior precisão do que uma 
única resposta. Avaliação de confiabilidade e incorpora- 
ção de escalas na análise são métodos que o pesquisador 
deve empregar. Para uma introdução mais detalhada a 
modelos de múltiplas medidas e construção de escalas, ver 
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discussão suplementar no Capítulo 3 (Análise Fatorial) e 
no Capítulo 10 (Modelagem de Equações Estruturais) ou 
textos adicionais [8]. Além disso, compilações de escalas 
que podem fornecer ao pesquisador uma escala “pronta 
para usar” com confiabilidade demonstrada foram publi- 
cadas recentemente [1,4]. 


O impacto do erro de medida 

O impacto de erro de medida e a confiabilidade ruim não 
podem ser diretamente percebidos, uma vez que estão em- 
butidos nas variáveis observadas. Portanto, o pesquisador 
sempre deve trabalhar para aumentar a confiabilidade e 
a validade, que em contrapartida resultarão em uma des- 
crição mais precisa das variáveis de interesse. Resultados 
pobres não são sempre por causa de erro de medida, mas 
a presença de erro de medida certamente distorce as rela- 
ções observadas e torna as técnicas multivariadas menos 
poderosas. Reduzir erro de medida, apesar de demandar 
esforço, tempo e recursos adicionais, pode melhorar re- 
sultados fracos ou marginais, bem como fortalecer resul- 
tados demonstrados. 


Significância estatística versus poder estatístico 


Todas as técnicas multivariadas, exceto análise de agru- 
pamentos e mapeamento perceptual, são baseadas na in- 
ferência estatística dos valores ou relações entre variáveis 
de uma população a partir de uma amostra aleatória ex- 
traída daquela população. Um censo da população inteira 
torna a inferência estatística desnecessária, pois qualquer 
diferença ou relação, não importa quão pequena, é “ver- 
dadeira” e existe. Entretanto, raramente, ou nunca, um 
censo é realizado. Logo, o pesquisador é obrigado a fazer 


inferências a partir de uma amostra. 


Tipos de erro estatístico e poder estatístico 
Interpretar inferências estatísticas requer que o pesqui- 
sador especifique os níveis de erro estatístico aceitáveis 
devido ao uso de uma amostra (conhecidos como erro 
amostral). A abordagem mais comum é especificar o ní- 
vel do erro Tipo I, também conhecido como alfa (01). O 
erro Tipo I é a probabilidade de rejeitar a hipótese nula 
quando a mesma é verdadeira, ou, em termos simples, a 
chance de o teste exibir significância estatística quando na 
verdade esta não está presente — o caso de um “positivo 
falso”. Ao especificar um nível alfa, o pesquisador estabe- 
lece os limites permitidos para erro, especificando a pro- 
babilidade de se concluir que a significância existe quando 
na realidade esta não ocorre. 

Quando especifica o nível de erro Tipo I, o pesquisa- 
dor também determina um erro associado, chamado de 
erro Tipo II ou beta (B). O erro Tipo II é a probabilidade 
de não rejeitar a hipótese nula quando na realidade esta é 
falsa. Uma probabilidade ainda mais interessante é 1 — B, 
chamada de poder do teste de inferência estatística. Poder 
é a probabilidade de rejeitar corretamente a hipótese nula 


quando esta deve ser rejeitada. Logo, poder é a probabi- 
lidade de a significância estatística ser indicada se estiver 
presente. A relação das diferentes probabilidades de erro 
na situação hipotética de teste para a diferença em duas 
médias é mostrada aqui: 


Realidade 
Sem diferença Diferença 
Ho: Sem diferença 1-a B 
. Erro Tipo Il 

Decisão 
estatística 1 

Ha: Diferença o -B 

Erro Tipo | Poder 


Apesar de a especificação de alfa estabelecer o nível 
de significância estatística aceitável, é o nível de poder 
que determina a probabilidade de “sucesso” em encontrar 
as diferenças se elas realmente existirem. Então por que 
não fixar ambos alfa e beta em níveis aceitáveis? Porque 
os erros Tipo I e Tipo II são inversamente relacionados, 
e, à medida que o erro Tipo I se torna mais restritivo (se 
aproxima de zero), a probabilidade de um erro Tipo II 
aumenta. Reduzir erros Tipo I, portanto, reduz o poder 
do teste estatístico. Assim, o pesquisador deve jogar com 
o equilíbrio entre o nível alfa e o poder resultante. 


Impactos sobre poder estatístico 

Mas por que níveis elevados de poder não podem ser al- 
cançados sempre? O poder não é apenas uma função de 
(alfa o). É, na verdade, determinado por três fatores: 


1. Tamanho do efeito - A probabilidade de atingir significân- 
cia estatística é baseada não apenas em considerações esta- 
tísticas, mas também na verdadeira magnitude do efeito de 
interesse (p. ex., uma diferença de médias entre dois grupos 
ou a correlação entre variáveis) na população, denominado 
tamanho do efeito. Como era de se esperar, um efeito maior 
é mais facilmente encontrado do que um efeito menor, o 
que causa impacto no poder do teste estatístico. Para avaliar 
o poder de qualquer teste estatístico, o pesquisador deve 
primeiro compreender o efeito sendo examinado. Os tama- 
nhos de efeito são definidos em termos padronizados para 
facilitar a comparação. As diferenças de média são dadas 
em termos de desvios-padrão, de modo que um tamanho de 
efeito de 0,5 indica que a diferença de média é metade de 
um desvio-padrão. Para correlações, o tamanho do efeito é 
baseado na real correlação entre as variáveis. 

2. Alfa (a) —- Como já foi discutido, quando alfa se torna mais 
restritivo, o poder diminui. Portanto, quando o pesquisador 
reduz a chance de incorretamente dizer que um efeito é sig- 
nificante quando não o é, a probabilidade de corretamente 
encontrar um efeito também diminui. Diretrizes convencio- 
nais sugerem níveis de alfa de 0,05 ou 0,01. Entretanto, o 
pesquisador deve considerar o impacto dessa decisão sobre 
o poder antes de selecionar o nível alfa. A relação dessas 
duas probabilidades é ilustrada em discussões posteriores. 

3. Tamanho da amostra — Em qualquer nível alfa, tamanhos 
de amostras aumentados sempre produzem maior poder 
do teste estatístico. Um problema potencial então se trans- 
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forma em poder excessivo. Por “excessivo” entende-se que 
aumentar o tamanho amostral implica que efeitos cada vez 
menores serão percebidos como estatisticamente significan- 
tes, até que em amostras muito grandes quase todo efeito é 
significante. O pesquisador sempre deve estar ciente de que 
o tamanho da amostra poderá impactar o teste estatístico, 
tornando-o insensível (com amostras pequenas) ou exage- 
radamente sensível (com amostras muito grandes). 


As relações entre alfa, tamanho da amostra, tama- 
nho do efeito e poder são muito complicadas, e muitas 
referências de orientação estão disponíveis. Cohen [5] 
examina o poder para a maioria dos testes de inferên- 
cia estatística e apresenta uma orientação para níveis 
aceitáveis de poder, sugerindo que estudos devem ser 
planejados para atingir níveis alfa de pelo menos 0,05 
com níveis de poder de 80%. Para atingir tais níveis de 
poder, os três fatores — alfa, tamanho da amostra e ta- 
manho do efeito — devem ser considerados simultanea- 
mente. Essas inter-relações podem ser ilustradas por 
dois exemplos simples. 


O primeiro exemplo envolve o teste para a diferença 
entre os escores médios de dois grupos. Considere que 
o tamanho do efeito deva variar entre pequeno (0,2) e 
moderado (0,5). O pesquisador agora deve determinar 
o nível alfa e o tamanho da amostra necessários de cada 
grupo. A Tabela 1-1 ilustra o impacto do tamanho da 
amostra e do nível alfa sobre o poder. Como se vê, o 
poder se torna aceitável com tamanhos de amostra de 
100 ou mais em situações com um tamanho de efeito 
moderado nos dois níveis alfa. Todavia, quando o ta- 
manho do efeito é pequeno, os testes estatísticos têm 
pouco poder, mesmo com níveis alfa expandidos ou 
amostras de 200 ou mais. Por exemplo, uma amostra de 
200 em cada grupo, com um alfa de 0,05, ainda tem ape- 
nas 50% de chance de diferenças significantes serem 
encontradas se o tamanho do efeito for pequeno. Isso 
sugere que se o pesquisador espera que os efeitos sejam 
pequenos, ele deverá planejar o estudo com tamanhos 
de amostra muito maiores e/ou níveis alfa menos restri- 
tivos (p. ex., 0,10). 

No segundo exemplo, a Figura 1-1 apresenta grafi- 
camente o poder para níveis de significância 0,01, 0,05 
e 0,10 para tamanhos de amostra de 30 a 300 por grupo, 
quando o tamanho do efeito (0,35) está entre pequeno e 
moderado. Diante de tais perspectivas, a especificação 
de um nível de significância de 0,01 requer uma amostra 
de 200 por grupo para atingir o nível desejado de 80% 
de poder. No entanto, se o nível alfa é relaxado, um po- 
der de 80% é alcançado com amostras de 130 para um 
nível alfa de 0,05 e de 100 para um nível alfa de 0,10. 


O uso do poder com técnicas multivariadas 
Tais análises permitem tomadas de decisão melhor in- 
formadas sobre o planejamento de estudo e a interpre- 


tação dos resultados. Ao planejar uma pesquisa, o pes- 
quisador deve estimar o tamanho esperado do efeito e 
então selecionar o tamanho da amostra e alfa para atin- 
gir o nível de poder desejado. Além de seus usos para 
planejamento, a análise de poder também é utilizada 
depois que a análise está completa para determinar o 
real poder alcançado, de modo que os resultados pos- 
sam ser apropriadamente interpretados. Os resultados 
são devido a tamanhos de efeito, tamanhos das amostras 
ou níveis de significância? O pesquisador pode avaliar 
cada um desses fatores por seu impacto na significância 
ou não-significância dos resultados. O pesquisador de 
hoje pode consultar estudos publicados que detalham as 
especificações da determinação de poder [5] ou apelar 
para diversos programas de computador que auxiliam 
no planejamento de estudos com o propósito de atingir 
o poder desejado ou calcular o poder de resultados reais 
[2,3]. Orientações específicas para regressão múltipla e 
análise multivariada de variância — as aplicações mais 
comuns de análise de poder — são discutidas com mais 
detalhes nos Capítulos 4 e 6. 

Uma vez abordadas as questões de estender técnicas 
multivariadas a partir de suas origens univariadas e biva- 
riadas, apresentamos um esquema de classificação para 
auxiliar na seleção da técnica apropriada pela especifica- 
ção dos objetivos da pesquisa (relação de independência 
ou dependência) e dos tipos de dados (métricos ou não- 
métricos). Em seguida, introduzimos brevemente cada 
método multivariado discutido no texto. 


UMA CLASSIFICAÇÃO DE 
TÉCNICAS MULTIVARIADAS 


Para auxiliá-lo a familiarizar-se com as técnicas multiva- 
riadas específicas, apresentamos uma classificação de mé- 


REGRAS PRÁTICAS 1-1 


Análise de poder estatístico 


Pesquisadores sempre devem planejar o estudo para 
conseguirem um nível de poder de 0,80 no nível de 
significância desejado. 

Níveis de significância mais estritos (p. ex., 0,01 no lugar 
de 0,05) requerem amostras maiores para atingir o nível 
de poder desejado. 

Reciprocamente, poder pode ser aumentado 
escolhendo-se um nível alfa menos estrito (p. ex., 0,10 
no lugar de 0,05) 

Tamanhos do efeito menores sempre demandam 
tamanhos amostrais maiores para atingir o poder 
desejado. 

Qualquer aumento em poder é mais facilmente 
conseguido aumentando-se o tamanho da amostra. 
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TABELA 1-1 
significância e tamanho do efeito 


Níveis de poder para a comparação de duas médias: variações por tamanho de amostra, nível de 


alfa (ot) = 0,05 alfa (o) = 0,01 
Tamanho do efeito (ES) Tamanho do efeito (ES) 
Tamanho da amostra Pequeno (0,2) Moderado (0,5) Pequeno (0,2) Moderado (0,5) 

20 0,095 0,338 0,025 0,144 

40 0,143 0,598 0,045 0,349 

60 0,192 0,775 0,067 0,549 

80 0,242 0,882 0,092 0,709 

100 0,290 0,940 0,120 0,823 

150 0,411 0,990 0,201 0,959 

200 0,516 0,998 0,284 0,992 


Fonte: SOLO Power Analysis, BMDP Statistical Software, Inc. [2] 


todos multivariados na Figura 1-2. Essa classificação é ba- 
seada em três julgamentos que o pesquisador deve fazer 
sobre o objetivo da pesquisa e a natureza dos dados: 


1. As variáveis podem ser divididas em classificações indepen- 
dentes e dependentes com base em alguma teoria? 

2. Se podem, quantas variáveis são tratadas como dependen- 
tes em uma única análise? 

3. Como as variáveis, sejam dependentes ou independentes, 
são medidas? 


A seleção da técnica multivariada adequada depende 
das respostas a essas três questões. 

Quando se considera a aplicação de técnicas estatís- 
ticas multivariadas, a resposta à primeira questão — as 


variáveis podem ser divididas em classificações indepen- 
dentes e dependentes com base em alguma teoria? — in- 
dica se uma técnica de dependência ou interdependência 
deveria ser utilizada. Note que na Figura 1-2 as técnicas 
de dependência estão no lado esquerdo, e as de interde- 
pendência estão à direita. Uma técnica de dependência 
pode ser definida como uma na qual uma variável ou 
conjunto de variáveis é identificada como a variável de- 
pendente a ser prevista ou explicada por outras variáveis 
conhecidas como variáveis independentes. Um exemplo 
de técnica de dependência é a análise de regressão múlti- 
pla. Em contrapartida, uma técnica de interdependência 
é aquela em que nenhuma variável ou grupo de variáveis 
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FIGURA 1-1 Impacto do tamanho da amostra sobre poder para vários níveis alfa (0,01, 0,05, 0,10) com tamanho de efeito 
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*O Capítulo que trata deste assunto está disponível no site www.bookman.com.br. 
FIGURA 1-2 Seleção de uma técnica multivariada. 
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é definida como sendo independente ou dependente. Ao 
invés disso, o procedimento envolve a análise simultânea 
de todas as variáveis no conjunto. Análise fatorial é um 
exemplo de técnica de interdependência. Focalizemos 
primeiramente as técnicas de dependência e usemos a 
classificação na Figura 1-2 para selecionar o método mul- 
tivariado apropriado. 


Técnicas de dependência 


As diferentes técnicas de dependência podem ser catego- 
rizadas por duas características: (1) o número de variáveis 
dependentes e (2) o tipo de escala de medida empregada 
pelas variáveis. Primeiro, no que se refere ao número de 
variáveis dependentes, técnicas de dependência podem 
ser classificadas como tendo uma única variável depen- 
dente, diversas variáveis dependentes, ou até mesmo di- 
versas relações de dependência/independência. Segundo, 
técnicas de dependência podem ser posteriormente classi- 
ficadas como aquelas com variáveis dependentes métricas 
(quantitativas/numéricas) ou não-métricas (qualitativas/ 
categóricas). Se a análise envolve uma única variável de- 
pendente que é métrica, a técnica apropriada é análise de 
regressão múltipla ou análise conjunta. Análise conjun- 
ta é um caso especial. Envolve um procedimento de de- 
pendência que pode tratar a variável dependente como 
métrica ou não-métrica, dependendo do tipo de dados 
coletados. Por outro lado, se a única variável dependente 
é não-métrica (categórica), então as técnicas adequadas 
são análise discriminante múltipla e modelos lineares de 
probabilidade. 

Quando o problema de pesquisa envolve diversas va- 
riáveis dependentes, outras quatro técnicas de análise são 
apropriadas. Se as diversas variáveis dependentes são mé- 
tricas, devemos olhar para as variáveis independentes. Se as 
mesmas são não-métricas, a técnica de análise multivariada 
de variância (MANOVA) deve ser escolhida. Se as variáveis 
independentes são métricas, correlação canônica é adequa- 
da. Se as diversas variáveis dependentes são não-métricas, 
então elas podem ser transformadas em uma codificação de 
variáveis dicotômicas e a análise canônica novamente pode 
ser utilizada. Finalmente, se um conjunto de relações de 
variáveis dependentes/independentes é postulado, então a 
modelagem de equações estruturais é apropriada. 

Existe uma relação muito grande entre os diversos 
procedimentos de dependência, os quais podem ser vistos 
como uma família de técnicas. A Tabela 1-2 define as vá- 
rias técnicas de dependência multivariada em termos da 


! Variáveis dicotômicas (ver Termos-chave) são discutidas mais de- 
talhadamente adiante. Resumidamente, a codificação de variável 
dicotômica é uma maneira de transformar dados não-métricos em 
dados métricos. Envolve a criação das chamadas variáveis dicotô- 
micas, nas quais 1s e Os são designados a indivíduos, dependendo 
de os mesmos possuírem ou não uma característica em questão. 
Por exemplo, se um indivíduo é do sexo masculino, designe a ele 
um 0, e se for do sexo feminino designe um 1, ou o contrário. 


natureza e número de variáveis dependentes e indepen- 
dentes. Como podemos perceber, a correlação canônica 
pode ser considerada como o modelo geral sobre o qual 
muitas outras técnicas multivariadas são baseadas, pois ela 
coloca o mínimo de restrições sobre o tipo e o número de 
variáveis em ambas as variáveis estatísticas, dependente e 
independente. À medida que restrições são colocadas so- 
bre variáveis estatísticas, conclusões mais precisas podem 
ser alcançadas com base na escala específica de medidas 
de dados empregada. Logo, técnicas multivariadas variam 
do método generalizado de análise canônica à técnica es- 
pecializada de modelagem de equações estruturais. 


Técnicas de interdependência 


Técnicas de interdependência são mostradas no lado di- 
reito da Figura 1-2. Os leitores deverão lembrar que com 
técnicas de interdependência as variáveis não podem ser 
classificadas como dependentes ou independentes. Em vez 
disso, todas as variáveis são analisadas simultaneamente 
em um esforço para encontrar uma estrutura subjacente a 
todo o conjunto de variáveis ou indivíduos. Se a estrutura 
de variáveis deve ser analisada, então a análise fatorial ou 
a análise fatorial confirmatória é a técnica recomendada. 
Se casos ou respondentes devem ser agrupados para re- 
presentar estrutura, então a análise de agrupamentos é 
selecionada. Finalmente, se o interesse está na estrutura 
de objetos, as técnicas de mapeamento perceptual deve- 
riam ser usadas. Como no caso das técnicas de dependên- 
cia, as propriedades de medida das técnicas deveriam ser 
consideradas. No caso geral, análise fatorial e análise de 
agrupamentos são consideradas como técnicas de inter- 
dependência métricas. No entanto, dados não-métricos 
podem ser transformados em uma codificação dicotômica 
para o emprego com formas especiais de análise fatorial e 
análise de agrupamentos. Ambas as abordagens métrica 
e não-métrica para o mapeamento perceptual foram de- 
senvolvidas. Se as interdependências de objetos medidos 
por dados não-métricos devem ser analisadas, a análise de 
correspondência também é adequada. 


TIPOS DE TÉCNICAS MULTIVARIADAS 


Análise multivariada é um conjunto de técnicas para aná- 
lise de dados que está sempre em expansão e que englo- 
ba um vasto domínio de possíveis situações de pesquisa, 
como se evidencia pelo esquema de classificação recém 
discutido. As técnicas mais estabelecidas, bem como as 
emergentes, incluem as seguintes: 


1. Análise de componentes principais e análise dos fatores 
comuns 

2. Regressão múltipla e correlação múltipla 

3. Análise discriminante múltipla e regressão logística 

4. Análise de correlação canônica 

5. Análise multivariada de variância e covariância 
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TABELA 1-2 A relação entre métodos de dependência multivariada 


Correlação canônica 


L+LANKde+Y, 
(métricas, não-métricas) 


KAS +X, 
(métricas, não-métricas) 


Análise multivariada de variância 


LL +Y, 


(métricas) 


XE +X, 
(não-métricas) 


Análise de variância 


Y, 
(métrica) 


XE +X, 
(não-métricas) 


Análise discriminante múltipla 


Y, 
(não-métrica) 


KA +X, 
(métricas) 


Análise de regressão múltipla 


Y, 
(métrica) 


X+MLAM+A+X, 
(métricas, não-métricas) 


Análise conjunta 


Y, 
(não-métrica, métrica) 


XE +X, 
(não-métricas) 


Modelagem de equações estruturais 


(métrica) 


6. Análise conjunta 
7. Análise de agrupamentos 
8. Mapeamento perceptual, também conhecido como escalo- 
namento multidimensional. 
9. Análise de correspondência 
10. Modelagem de equações estruturais e análise fatorial confir- 
matória 


Aqui introduzimos cada uma das técnicas multivaria- 
das, definindo brevemente a técnica e o objetivo para sua 
aplicação. 


Análise de componentes principais 
e análise dos fatores comuns 


Análise fatorial, que inclui análise de componentes prin- 
cipais e análise dos fatores comuns, é uma abordagem es- 
tatística que pode ser usada para analisar inter-relações 
entre um grande número de variáveis e explicar essas 
variáveis em termos de suas dimensões inerentes comuns 
(fatores). O objetivo é encontrar um meio de condensar a 
informação contida em várias variáveis originais em um 
conjunto menor de variáveis estatísticas (fatores) com 
uma perda mínima de informação. Pelo fato de fornecer 
uma estimativa empírica da estrutura das variáveis consi- 
deradas, a análise fatorial se torna uma base objetiva para 
criar escalas múltiplas. 


Xnt Xp + Xat Kin 
Ko: Koo Kos Rose Kon 
Xm + Xro + Xma + + Xm 


(métricas, não-métricas) 


Um pesquisador pode usar análise fatorial, por exem- 
plo, para melhor entender as relações entre avaliações 
de clientes de uma lanchonete. Considere que você peça 
a clientes para avaliarem o local sobre as seguintes seis 
variáveis: sabor da comida, temperatura da comida, se 
a comida é fresca, tempo de espera, limpeza, e atendi- 
mento por parte de empregados. O analista gostaria de 
combinar essas seis variáveis em um número menor. 
Analisando as respostas, o analista pode descobrir que 
as variáveis sabor, temperatura e frescor se combinam 
para, juntas, formar um único fator de qualidade de co- 
mida, enquanto as variáveis tempo de espera, limpeza, 
e atendimento se combinam para compor outro fator, 
qualidade de serviço. 


Regressão múltipla 


Regressão múltipla é o método de análise apropriado quan- 
do o problema de pesquisa envolve uma única variável de- 
pendente métrica considerada como relacionada a duas ou 
mais variáveis independentes métricas. O objetivo da aná- 
lise de regressão múltipla é prever as mudanças na variável 
dependente como resposta a mudanças nas variáveis inde- 
pendentes. Esse objetivo é alcançado, com fregiiência, por 
meio da regra estatística dos mínimos quadrados. 
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Sempre que o pesquisador estiver interessado em pre- 
ver a quantia ou magnitude da variável dependente, a 
regressão múltipla será útil. Por exemplo, despesas men- 
sais com jantares fora de casa (variável dependente) po- 
dem ser previstas a partir de informações referentes a 
renda familiar, tamanho da família e idade do chefe da 
família (variáveis independentes). Do mesmo modo, o 
pesquisador pode tentar prever as vendas de uma em- 
presa a partir de informações sobre suas despesas em 
publicidade, o número de vendedores e o número de lo- 
jas que vendem seus produtos. 


Análise discriminante múltipla 
e regressão logística 


Análise discriminante múltipla (MDA — multiple discrimi- 
nant analysis) é a técnica multivariada adequada quando 
a única variável dependente é dicotômica (p. ex., masculi- 
no-feminino) ou multicotômica (p. ex., alto-médio-baixo) 
e, portanto, não-métrica. Como na regressão múltipla, 
pressupõe-se que as variáveis independentes sejam métri- 
cas. A análise discriminante é aplicável em situações nas 
quais a amostra total pode ser dividida em grupos basea- 
dos em uma variável dependente não-métrica que carac- 
teriza diversas classes conhecidas. Os objetivos primários 
da análise discriminante múltipla são entender diferenças 
de grupos e prever a probabilidade de que uma entidade 
(indivíduo ou objeto) pertencerá a uma classe ou grupo 
em particular com base em diversas variáveis independen- 
tes métricas. 


A análise discriminante poderia ser empregada para 
distinguir inovadores de não-inovadores de acordo com 
seus perfis demográficos e psicográficos. Outras aplica- 
ções incluem a distinção de usuários de peso daqueles 
que não o são, sexo masculino de sexo feminino, consu- 
midores de marcas nacionais de consumidores de mar- 
cas importadas, e bons riscos de crédito de riscos ruins 
de crédito. Até mesmo o Internal Revenue Service dos 
EUA usa análise discriminante para comparar restitui- 
ções de impostos federais selecionadas com uma resti- 
tuição hipotética de contribuinte composta e normal 
(com diferentes níveis de renda) para identificar as resti- 
tuições mais promissoras e áreas para auditoria. 


Modelos de regressão logística, frequentemente cha- 
mados de análise logit, são uma combinação de regressão 
múltipla e análise discriminante múltipla. Essa técnica é 
semelhante à análise de regressão múltipla no sentido de 
que uma ou mais variáveis independentes são usadas para 
prever uma única variável dependente. O que diferencia 
um modelo de regressão logística de uma regressão múl- 


tipla é que a variável dependente é não-métrica, como na 
análise discriminante. A escala não-métrica da variável 
dependente exige diferenças no método de estimação e 
suposições sobre o tipo de distribuição inerente, ainda que 
na maioria dos outros aspectos seja muito semelhante à re- 
gressão múltipla. Logo, uma vez que a variável dependen- 
te está corretamente especificada e a técnica adequada de 
estimação é empregada, os fatores básicos considerados na 
regressão múltipla são igualmente usados aqui. Modelos 
de regressão logística são diferenciados de análise discri- 
minante principalmente no sentido de que eles acomodam 
todos os tipos de variáveis independentes (métricas e não- 
métricas) e não exigem a suposição de normalidade mul- 
tivariada. Não obstante, em muitos casos, particularmente 
com mais de dois níveis da variável dependente, a análise 
discriminante é a técnica mais apropriada. 


Considere que consultores financeiros estavam ten- 
tando desenvolver um meio para selecionar empresas 
emergentes para investimentos de apoio. Para auxiliar 
nessa tarefa eles analisaram arquivos antigos e coloca- 
ram firmas em uma de duas classes: bem-sucedidas por 
mais de cinco anos e malsucedidas após cinco anos. Para 
cada firma eles também tinham uma abundância de da- 
dos financeiros e administrativos. Eles poderiam então 
usar um modelo de regressão logística para identificar 
aqueles dados financeiros e administrativos que melhor 
diferenciavam as empresas bem-sucedidas das malsuce- 
didas, a fim de selecionar os melhores candidatos para 
investimento no futuro. 


Correlação canônica 


A análise de correlação canônica pode ser vista como uma 
extensão lógica da análise de regressão múltipla. Lembre 
que a análise de regressão múltipla envolve uma única va- 
riável dependente métrica e várias variáveis independen- 
tes métricas. Com a análise canônica, o objetivo é corre- 
lacionar simultaneamente diversas variáveis dependentes 
métricas e diversas variáveis independentes métricas. En- 
quanto a regressão múltipla envolve uma única variável 
dependente, a correlação canônica envolve múltiplas va- 
riáveis dependentes. O princípio subjacente é desenvolver 
uma combinação linear de cada conjunto de variáveis (in- 
dependentes e dependentes) para maximizar a correlação 
entre os dois conjuntos. Em outras palavras, o procedi- 
mento envolve a obtenção de um conjunto de pesos para 
as variáveis dependentes e independentes que fornece a 
correlação simples máxima entre o conjunto de variáveis 
dependentes e o de variáveis independentes. Essa técnica 
não é discutida neste texto, mas um capítulo que fornece 
uma visão geral e aplicação da técnica está disponível no 
site www.bookman.com.br. 


CAPÍTULO 1 Introdução 35 


Imagine que uma empresa conduz um estudo que coleta 
informação sobre qualidade de seu serviço baseado em 
respostas a 50 questões metricamente medidas. O estu- 
do utiliza questões de pesquisas de qualidade de serviços 
publicadas e inclui informação padrão sobre percepções 
da qualidade de serviço de “companhias de classe mun- 
dial” bem como da companhia para a qual a pesquisa 
está sendo conduzida. Correlação canônica poderia ser 
usada para comparar as percepções das companhias de 
qualidade sobre as 50 questões com as percepções da 
empresa em questão. A pesquisa poderia então concluir 
se as percepções da empresa estão correlacionadas com 
aquelas das empresas de classe mundial. A técnica forne- 
ceria informação sobre a correlação geral de percepções, 
bem como a correlação entre cada uma das 50 questões. 


Análise multivariada de variância e covariância 


A análise multivariada de variância (MANOVA- multi- 
variate analysis of variance) é uma técnica estatística que 
pode ser usada para explorar simultaneamente as relações 
entre diversas variáveis independentes categóricas (geral- 
mente chamadas de tratamentos) e duas ou mais variáveis 
dependentes métricas. Como tal, representa uma extensão 
da análise univariada de variância (ANOVA — univariate 
analysis of variance). A análise multivariada de covariância 
(MANCOVA -— multivariate analysis of covariance) pode 
ser usada em conjunção com MANOVA para remover 
(após o experimento) o efeito de quaisquer variáveis in- 
dependentes métricas não controladas (conhecidas como 
covariáveis estatísticas) sobre as variáveis dependentes. O 
procedimento é análogo ao envolvido na correlação parcial 
bivariada, na qual o efeito de uma terceira variável é remo- 
vido da correlação. MANOVA é útil quando o pesquisador 
planeja uma situação experimental (manipulação de várias 
variáveis não-métricas de tratamento) para testar hipóteses 
referentes à variância em respostas nos grupos sobre duas 
ou mais variáveis dependentes métricas. 


Imagine que uma empresa quer saber se um anúncio di- 
vertido seria mais eficiente com seus clientes do que um 
anúncio não engraçado. Ela poderia solicitar à sua agência 
de publicidade a criação de dois anúncios — um engraçado 
e outro não — e então exibir os dois comerciais para um 
grupo de clientes. Após assistirem ambos, os clientes se- 
riam indagados para avaliarem a empresa e seus produtos 
em diversas dimensões, como moderna versus tradicio- 
nal, ou alta qualidade versus baixa qualidade. MANOVA 
seria a técnica a ser usada com o objetivo de determinar a 
extensão de quaisquer diferenças estatísticas entre as per- 
cepções de clientes que viram o anúncio divertido versus 
aqueles que viram o que não é engraçado. 


Análise conjunta 


A análise conjunta é uma técnica emergente de depen- 
dência que tem trazido nova sofisticação para a avaliação 
de objetos, como novos produtos, serviços ou idéias. A 
aplicação mais direta é no desenvolvimento de novos pro- 
dutos ou serviços, viabilizando a avaliação de produtos 
complexos e mantendo um contexto realista de decisão 
para o respondente. O pesquisador de mercado é capaz de 
avaliar a importância de atributos, bem como dos níveis 
de cada atributo, enquanto consumidores avaliam apenas 
uns poucos perfis do produto, os quais são combinações 
de níveis de produto. 


Considere que um dado produto tenha três atributos 
(preço, qualidade e cor), cada um com três níveis possí- 
veis (p. ex., vermelho, amarelo e azul). Em vez de ava- 
liar todas as 27 (3 x 3 x 3) combinações possíveis, um 
subconjunto (9 ou mais) pode ser avaliado por seu ape- 
lo perante consumidores, e o pesquisador sabe não ape- 
nas o quão importante cada atributo é, mas também a 
importância de cada nível (p. ex., a atratividade de ver- 
melho versus amarelo versus azul). Além disso, quando 
as avaliações do consumidor são concluídas, os resulta- 
dos da análise conjunta podem igualmente ser usados 
em simuladores de planejamento do produto, os quais 
mostram a aceitação do consumidor a qualquer número 
de formulações do produto e ajudam no planejamento 
do produto ótimo. 


Análise de agrupamentos 


A análise de agrupamentos é uma técnica analítica para 
desenvolver subgrupos significativos de indivíduos ou ob- 
jetos. Especificamente, o objetivo é classificar uma amos- 
tra de entidades (indivíduos ou objetos) em um número 
menor de grupos mutuamente excludentes, com base nas 
similaridades entre as entidades. Na análise de agrupa- 
mentos, diferentemente da análise discriminante, os gru- 
pos não são pré-definidos. Ao invés disso, a técnica é usa- 
da para identificar os grupos. 

A análise de agrupamentos geralmente envolve pelo 
menos três passos. O primeiro é a medida de alguma 
forma de similaridade ou associação entre as entidades 
para determinar quantos grupos realmente existem na 
amostra. O segundo passo é o real processo de agru- 
pamento, onde entidades são particionadas em grupos 
(agrupamentos). O último passo é estabelecer o perfil 
das pessoas ou variáveis para determinar sua composi- 
ção. Muitas vezes, isso é possível pela aplicação da análi- 
se discriminante aos grupos identificados pela técnica de 
agrupamento. 
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Como exemplo de análise de agrupamentos, considere- 
mos um dono de restaurante que queira saber se clientes 
são fiéis ao restaurante por diferentes razões. Dados po- 
deriam ser coletados sobre percepções de preços, qua- 
lidade da comida e assim por diante. A análise de agru- 
pamentos poderia ser usada para determinar se alguns 
subgrupos (agrupamentos) estão altamente motivados 
pelos baixos preços versus aqueles que estão menos mo- 
tivados a virem ao restaurante por conta de preços. 


Mapeamento perceptual 


No mapeamento perceptual (também conhecido como es- 
calonamento multidimensional), o objetivo é transformar 
Julgamentos de consumidores sobre similaridade ou prefe- 
rência (p. ex., preferência por lojas ou marcas) em distân- 
cias representadas em um espaço multidimensional. Se os 
respondentes julgam os objetos A e B os mais semelhan- 
tes, comparados com todos os outros possíveis pares de 
objetos, técnicas de mapeamento perceptual colocarão os 
objetos A e B de tal forma que a distância entre eles no es- 
paço multidimensional seja menor do que a distância entre 
quaisquer outros pares de objetos. Os mapas perceptuais 
resultantes exibem a posição relativa de todos os objetos, 
mas análises adicionais são necessárias para descrever ou 
avaliar quais atributos ditam a posição de cada objeto. 


Como exemplo de mapeamento perceptual, considere- 
mos um proprietário de uma loja do McDonald's que 
queira saber se o maior competidor é o Habib's ou Pizza 
Hut. A uma amostra de clientes é dado um questioná- 
rio no qual se pede para avaliar os pares de lanchonetes 
como mais semelhantes e menos semelhantes. Os resul- 
tados mostram que o McDonald's é mais parecido com o 
Habib's, e assim os proprietários sabem que o mais for- 
te competidor é o Habib's, pois o mesmo é considerado 
como o mais semelhante. Análises posteriores podem 
identificar quais atributos influenciam percepções de se- 
melhança ou diferença. 


Análise de correspondência 


A análise de correspondência é uma técnica de interde- 
pendência recentemente desenvolvida que facilita o ma- 
peamento perceptual de objetos (p. ex., produtos, pessoas) 
em um conjunto de atributos não-métricos. Pesquisadores 
são constantemente defrontados com a necessidade de 
“quantificar os dados qualitativos” encontrados em va- 
riáveis nominais. A análise de correspondência difere das 
técnicas de interdependência discutidas anteriormente em 
sua habilidade para acomodar tanto dados não-métricos 
quanto relações não-lineares. 

Em sua forma mais básica, a análise de correspon- 
dência emprega uma tabela de contingência, que é a ta- 


bulação cruzada de duas variáveis categóricas. Ela então 
transforma os dados não-métricos em um nível métrico 
e faz redução dimensional (análoga à análise fatorial) e 
mapeamento perceptual. A análise de correspondência 
fornece uma representação multivariada de interdepen- 
dência para dados não-métricos que não é possível com 
outros métodos. 


Como exemplo, preferências de respondentes a mar- 
cas podem ser tabuladas no cruzamento com variáveis 
demográficas (p. ex., sexo, categorias de renda, ocu- 
pação), indicando quantas pessoas que preferem cada 
marca recaem em cada categoria das variáveis demo- 
gráficas. Por meio de análise de correspondência, a as- 
sociação ou “correspondência” de marcas e diferentes 
características daqueles que preferem cada marca é 
então mostrada em um mapa bi ou tridimensional de 
marcas e características dos respondentes. Marcas que 
são percebidas como semelhantes são colocadas pró- 
ximas umas das outras. Do mesmo modo, as caracte- 
rísticas mais eminentes de respondentes que preferem 
cada marca também são determinadas pela proximida- 
de das categorias de variáveis demográficas às posições 
das marcas. 


Modelagem de equações estruturais 
e análise fatorial confirmatória 


Modelagem de equações estruturais (SEM), comumente 
chamada de LISREL (o nome de um dos programas de 
computador mais conhecidos), é uma técnica que permi- 
te separar relações para cada conjunto de variáveis de- 
pendentes. Em seu sentido mais simples, a modelagem 
de equações estruturais fornece a técnica de estimação 
apropriada e mais eficiente para uma série de equações 
de regressão múltipla separadas estimadas simultanea- 
mente. É caracterizada por dois componentes básicos: (1) 
o modelo estrutural e (2) o modelo de medida. O modelo 
estrutural é o modelo de caminhos, que relaciona variá- 
veis independentes com dependentes. Em tais situações, 
teoria, experiência prévia ou outras orientações permitem 
ao pesquisador distinguir quais variáveis independentes 
prevêem cada variável dependente. Os modelos discu- 
tidos anteriormente que acomodam múltiplas variáveis 
dependentes — análise multivariada de variância e corre- 
lação canônica — não se aplicam nessa situação, pois eles 
permitem apenas uma única relação entre variáveis de- 
pendentes e independentes. 

O modelo de medida permite ao pesquisador usar di- 
versas variáveis (indicadores) para uma única variável 
independente ou dependente. Por exemplo, a variável 
dependente poderia ser um conceito representado por 
uma escala múltipla, como auto-estima. Em uma análise 
fatorial confirmatória o pesquisador pode avaliar a con- 
tribuição de cada item da escala, bem como incorporar a 
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maneira como a escala mede o conceito (confiabilidade). 
As escalas são então integradas na estimação das relações 
entre variáveis dependentes e independentes no modelo 
estrutural. Esse procedimento é semelhante a executar 
uma análise fatorial (discutida em uma seção anterior) dos 
itens da escala e usar os escores fatoriais na regressão. 


Um estudo promovido por consultores administrativos 
identificou diversos fatores que afetam a satisfação do 
trabalhador: apoio do supervisor, ambiente de trabalho 
e desempenho no emprego. Além dessa relação, eles 
perceberam uma relação à parte na qual apoio do su- 
pervisor e ambiente de trabalho eram preditores únicos 
de desempenho no emprego. Logo, eles tinham duas re- 
lações separadas, mas inter-relacionadas. Apoio do su- 
pervisor e o ambiente de trabalho não apenas afetavam 
diretamente a satisfação do trabalhador, mas tinham 
possíveis efeitos indiretos através da relação com de- 
sempenho no emprego, que era também um preditor de 
satisfação do trabalhador. Na tentativa de avaliar essas 
relações, os consultores também desenvolveram escalas 
de múltiplos itens para cada construto (apoio do super- 
visor, ambiente de trabalho, desempenho no emprego, 
e satisfação do trabalhador). SEM fornece um meio de 
não somente avaliar cada uma das relações simultanea- 
mente no lugar de análises em separado, mas também de 
incorporar as escalas de múltiplos itens na análise para 
explicar o erro de medida associado com cada escala. 


DIRETRIZES PARA ANÁLISES ; 
MULTIVARIADAS E INTERPRETAÇÃO 


Como mostrado neste capítulo, o caráter diverso da aná- 
lise multivariada conduz a uma poderosa capacidade ana- 
lítica e preditiva. Esse poder é especialmente tentador 
quando o pesquisador está inseguro sobre o planejamen- 
to de análise mais apropriado e confia, no lugar disso, na 
técnica multivariada como um substituto para o desen- 
volvimento conceitual necessário. Mesmo quando corre- 
tamente aplicada, a eficácia na acomodação de múltiplas 
variáveis e relações cria substancial complexidade nos re- 
sultados e suas interpretações. 

Diante dessa complexidade, advertimos o pesquisador 
para proceder apenas quando a necessária base conceitual 
para suportar a técnica selecionada foi desenvolvida. Já 
discutimos diversas questões particularmente aplicáveis 
à análise multivariada e, apesar de não haver uma “res- 
posta” única, julgamos que a análise e a interpretação de 
qualquer problema multivariado podem ser auxiliadas 
seguindo-se uma série de diretrizes gerais. Apesar de não 
ser uma lista exaustiva de considerações, essas diretrizes 
representam mais uma “filosofia de análise multivariada” 


que nos tem sido útil. As seções seguintes discutem esses 
pontos sem obedecer a uma ordem particular, e com igual 
ênfase em todos. 


Estabelecer significância prática, bem 
como significância estatística 


A força da análise multivariada é sua habilidade aparen- 
temente mágica de classificar um grande número de pos- 
síveis alternativas e encontrar aquelas que têm significân- 
cia estatística. Entretanto, com esse poder vem também 
a cautela. Muitos pesquisadores ficam míopes ao se con- 
centrarem somente na significância alcançada dos resulta- 
dos sem compreender suas interpretações, sejam boas ou 
ruins. Ao invés disso, o pesquisador deve olhar não ape- 
nas a significância estatística dos resultados, mas também 
sua significância prática. A significância prática faz a per- 
gunta “E daí?”. Para qualquer aplicação administrativa, 
os resultados devem ter um efeito demonstrável que justi- 
fique uma ação. Em termos acadêmicos, a pesquisa está se 
concentrando não apenas em resultados estatisticamente 
significantes, mas também em suas implicações substanti- 
vas e teóricas, as quais são muitas vezes extraídas de sua 
significância prática. 


Por exemplo, uma análise de regressão é usada para pre- 
ver intenções de recompra, medidas como a probabili- 
dade entre O e 100 de que o cliente comprará novamente 
da firma. O estudo é conduzido e os resultados retornam 
significantes no nível de significância de 0,05. Os executi- 
vos se apressam em acatar os resultados e modificar a es- 
tratégia da firma de acordo com eles. No entanto, passa 
despercebido que, mesmo que a relação fosse significan- 
te, a habilidade de previsão era pobre — tão pobre que a 
estimativa de probabilidade de recompra poderia variar 
+ 20% no nível de significância de 0,05. A relação “es- 
tatisticamente significante” poderia, portanto, ter uma 
margem de erro de 40 pontos percentuais! Um cliente 
previsto como tendo 50% de chance de retornar poderia 
realmente ter probabilidades de 30 a 70%, representan- 
do níveis inaceitáveis para uma ação. Se pesquisadores e 
administradores tivessem sondado a significância prática 
ou administrativa dos resultados, teriam concluído que a 
relação ainda precisava de refinamento, caso devesse ser 
confiável a ponto de orientar qualquer estratégia. 


Reconhecer que o tamanho da 
amostra afeta todos os resultados 


A discussão sobre poder estatístico demonstrou o impac- 
to profundo que o tamanho da amostra representa para 
atingir a significância estatística, tanto para pequenas 
amostras quanto grandes. Para amostras menores, a so- 
fisticação e complexidade da técnica multivariada podem 
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facilmente resultar em (1) baixíssimo poder estatístico 
para o teste identificar realisticamente resultados sig- 
nificantes, ou (2) um “ajuste” muito fácil dos dados, de 
modo que os resultados são artificialmente bons porque 
se ajustam muito bem na amostra, mas sem poder de ge- 
neralização. 

Um impacto semelhante também ocorre para amos- 
tras muito grandes, as quais, como anteriormente discu- 
tido, podem tornar os testes estatísticos muito sensíveis. 
Sempre que tamanhos de amostras excederem 400 res- 
pondentes, o pesquisador deverá examinar todos os resul- 
tados significantes para garantir que tenham significância 
prática devido ao poder estatístico aumentado pelo tama- 
nho da amostra. 

Tamanhos de amostra também afetam os resultados 
quando a análise envolve grupos de respondentes, como 
na análise discriminante ou em MANOVA. Tamanhos 
de amostra diferentes entre grupos influenciam os re- 
sultados e exigem interpretação e/ou análise adicionais. 
Logo, um pesquisador ou usuário de técnicas multivaria- 
das sempre deve avaliar os resultados à luz da amostra 
usada na análise. 


Conhecer seus dados 


As técnicas multivariadas, por natureza, identificam rela- 
ções complexas muito difíceis de serem representadas de 
maneira simples. Conseqientemente, a tendência é acei- 
tar os resultados sem o exame comum que se promove 
nas análises univariada e bivariada (p. ex., diagramas de 
dispersão de correlações e gráficos de caixas em compa- 
rações de médias). No entanto, tais atalhos podem ser um 
prelúdio para o desastre. A análise multivariada demanda 
um exame até mesmo mais rigoroso dos dados, pois a in- 
fluência de observações atípicas, violações das suposições 
e dados perdidos podem aparecer em diversas variáveis 
com efeitos substanciais. 

Um conjunto crescente de técnicas de diagnóstico 
permite a descoberta dessas relações multivariadas de 
maneiras muito semelhantes aos métodos univariados e 
bivariados. O pesquisador multivariado deve dispor de 
tempo para usar essas medidas diagnósticas para uma me- 
lhor compreensão dos dados e das relações básicas exis- 
tentes. Com essa compreensão, o pesquisador se agarra 
não apenas ao “quadro geral”, mas também sabe onde 
procurar por formulações alternativas do modelo original 
que podem ajudar no ajuste do modelo, como relações 
não-lineares e interativas. 


Esforçar-se por modelos parcimoniosos 


As técnicas multivariadas são planejadas para acomodar 
múltiplas variáveis na análise. Essa característica, contu- 
do, não deveria substituir o desenvolvimento do modelo 
conceitual antes de as técnicas multivariadas serem aplica- 
das. Apesar de sempre ser mais importante evitar a omis- 
são de uma variável preditora crítica, o que se chama de 


erro de especificação, o pesquisador também deve evitar 
a inserção indiscriminada de variáveis, esperando que a 
técnica multivariada “arrume” as variáveis relevantes, por 
duas razões fundamentais: 


1. Variáveis irrelevantes geralmente aumentam a habilidade 
da técnica de ajustar os dados da amostra, mas ao preço de 
superajustar os dados e tornar os resultados menos generali- 
záveis à população. Tratamos dessa questão mais detalhada- 
mente quando o conceito de graus de liberdade é discutido 
no Capítulo 4. 

2. A despeito das variáveis irrelevantes tipicamente não vie- 
sarem as estimativas das variáveis relevantes, elas podem 
mascarar os verdadeiros efeitos por causa de um aumento 
da multicolinearidade. Multicolinearidade representa o 
grau em que qualquer efeito de variável pode ser previsto 
ou explicado pelas outras variáveis na análise. Quando a 
multicolinearidade aumenta, a habilidade de definir qual- 
quer efeito de variável diminui. Incluir variáveis irrelevan- 
tes ou de significado marginal pode apenas aumentar o grau 
de multicolinearidade, o que torna a interpretação de todas 
as variáveis mais complicada. 


Logo, incluir variáveis que não são conceitualmente 
relevantes pode conduzir a vários efeitos nocivos, mesmo 
se as variáveis adicionais não viesam diretamente os resul- 
tados do modelo. 


Examinar seus erros 


Mesmo com o alcance estatístico das técnicas multivaria- 
das, raramente atingimos a melhor previsão na primei- 
ra análise. O pesquisador deve então encarar a questão 
“Para onde vamos a partir daqui?”. A melhor resposta é 
examinar os erros na previsão, se eles são os resíduos da 
análise de regressão, os erros na classificação de observa- 
ções na análise discriminante, ou observações atípicas na 
análise de agrupamentos. Em cada caso, o pesquisador 
deve usar os erros na previsão não como uma medida de 
falha ou algo que simplesmente deve ser eliminado, mas 
como um ponto de partida para diagnosticar a validade 
dos resultados obtidos e uma indicação das relações res- 
tantes sem explicação. 


Validar seus resultados 


A habilidade da análise multivariada para identificar in- 
ter-relações complexas também significa que podem ser 
encontrados resultados específicos apenas para a amos- 
tra e não-generalizáveis para a população. O pesquisador 
sempre deve garantir que haja observações suficientes por 
parâmetro estimado, para evitar “superajustamento” da 
amostra, como já discutido. Contudo, igualmente impor- 
tantes são os esforços para validar os resultados por qual- 
quer dentre os vários métodos, incluindo: 


1. Separar a amostra, e usar uma subamostra para estimar o 
modelo e a segunda para estimar a precisão de previsão. 

2. Juntar uma amostra em separado para garantir que os resul- 
tados são apropriados para outras amostras. 
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3. Empregar a técnica bootstrapping [6], a qual valida um mo- 
delo multivariado pela extração de um grande número de 
subamostras, estimando modelos para cada subamostra e 
então determinando os valores para as estimativas de parà- 
metros a partir do conjunto de modelos, calculando a média 
de cada coeficiente estimado ao longo de todos os modelos 
de sub-amostras. Essa abordagem também não se baseia em 
suposições estatísticas para avaliar se um parâmetro difere 
de zero (ou seja, são os coeficientes estimados estatistica- 
mente diferentes de zero ou não?). Em vez disso, ela exami- 
na os valores reais a partir de repetidas amostras para fazer 
tal avaliação. 


Sempre que uma técnica multivariada for empregada, 
o pesquisador deve se esforçar não apenas para estimar 
um modelo significante, mas para garantir que ele seja re- 
presentativo da população como um todo. Lembre-se de 
que o objetivo não é determinar o melhor “ajuste” apenas 
para os dados da amostra, mas desenvolver um modelo 
que melhor descreva a população como um todo. 


UM TRATAMENTO ESTRUTURADO 
PARA CONSTRUIR MODELOS 
MULTIVARIADOS 


À medida que discutimos as numerosas técnicas multi- 
variadas disponíveis ao pesquisador e a miríade de ques- 
tões envolvidas em suas aplicações, fica aparente que a 
conclusão bem-sucedida de uma análise multivariada en- 
volve mais do que somente a seleção do método correto. 
Questões que variam da definição do problema à diagnose 
crítica dos resultados devem ser abordadas. Para ajudar o 
pesquisador ou o usuário a aplicar métodos multivariados, 
um tratamento com seis passos para a análise multivariada 
é apresentado. A meta não é fornecer um conjunto rígido 
de procedimentos a serem seguidos, mas sim orientações 
que enfatizam uma maneira de construir modelos. Esse 
tratamento para a construção de modelos se concentra na 
análise em um plano de pesquisa bem-definido, começan- 
do com um modelo conceitual que detalhe as relações a se- 
rem examinadas. Uma vez definido em termos conceituais, 
as questões empíricas podem ser abordadas, incluindo a 
seleção da técnica multivariada específica e os problemas 
de implementação. Depois que foram obtidos resultados 
significantes, concentramo-nos em sua interpretação, com 
especial atenção à variável estatística. Finalmente, as me- 
didas diagnósticas garantem que o modelo não é válido 
apenas para os dados da amostra, mas que é tão generali- 
zável quanto possível. A discussão que se segue brevemen- 
te descreve cada passo desse tratamento. 

Esse processo de seis passos para construir modelos 
fornece uma estrutura para desenvolver, interpretar e vali- 
dar qualquer análise multivariada. Cada pesquisador deve 
desenvolver critérios para “sucesso” ou “falha” em cada 
estágio, mas as discussões de cada técnica fornecem orien- 
tações sempre que disponíveis. Neste ponto, a ênfase em 


um tratamento de construção de modelos, em vez de sim- 
plesmente apontar as especificidades de cada técnica, deve- 
ria fornecer uma base mais ampla para o desenvolvimento, 
estimação e interpretação de modelos, que irão melhorar a 
análise multivariada do profissional e do acadêmico. 


Estágio 1: Definição do problema 
da pesquisa, dos objetivos e da 
técnica multivariada a ser usada 


O ponto de partida para qualquer análise multivariada é 
definir o problema da pesquisa e os objetivos de análise 
em termos conceituais, antes de especificar quaisquer va- 
riáveis ou medidas. O papel do desenvolvimento do mo- 
delo conceitual, ou da teoria, não pode ser superestimado. 
Não importa se é pesquisa aplicada ou acadêmica, o pes- 
quisador deve primeiro ver o problema em termos con- 
ceituais, definindo os conceitos e identificando as relações 
fundamentais a serem investigadas. Desenvolver um mo- 
delo conceitual não é atribuição exclusiva de acadêmicos; 
é também algo ajustado para aplicação no mundo real. 

Um modelo conceitual não precisa ser complexo e de- 
talhado; pode ser uma simples representação das relações 
a serem estudadas. Se uma relação de dependência é pro- 
posta como o objetivo de pesquisa, o pesquisador preci- 
sa especificar os conceitos dependentes e independentes. 
Para uma aplicação de uma técnica de interdependência, 
as dimensões de estrutura ou similaridade devem ser espe- 
cificadas. Note que um conceito, diferentemente de uma 
variável, é definido em ambas as situações, sejam de de- 
pendência ou de interdependência. O pesquisador primei- 
ro identifica as idéias ou os tópicos de interesse, em vez 
de se concentrar nas medidas específicas a serem usadas. 
Essa seqiiência minimiza a chance de conceitos relevantes 
serem omitidos no esforço de desenvolver medidas e de 
definir as especificidades do plano de pesquisa. Os leitores 
interessados no desenvolvimento de modelos conceituais 
devem ver o Capítulo 10. 

Com os objetivos e o modelo conceitual especificados, 
o pesquisador deve apenas escolher a técnica multivaria- 
da apropriada. O uso de um método de dependência ou 
interdependência é selecionado, e então a última decisão 
é selecionar a técnica em particular com base nas carac- 
terísticas de medidas das variáveis dependentes e inde- 
pendentes. Variáveis para cada conceito são especificadas 
antes do estudo em seu planejamento, mas podem ser 
re-especificadas ou mesmo estabelecidas de uma forma 
diferente (p. ex., transformações ou criações de variáveis 
dicotômicas) após a coleta de dados. 


Estágio 2: Desenvolvimento do plano de análise 


Com o modelo conceitual estabelecido e a técnica multi- 
variada selecionada, a atenção se volta para a implemen- 
tação. Para cada técnica, o pesquisador deve desenvolver 
um plano de análise que aborde as questões particulares 
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a seu propósito e projeto. As questões incluem considera- 
ções gerais, como tamanho mínimo ou desejado da amos- 
tra e tipos permitidos ou exigidos de variáveis (métricas 
versus não-métricas) e métodos de estimação, além de as- 
pectos específicos, como o tipo de medidas de associação 
usadas em mapeamento perceptual, a estimação de resul- 
tados agregados ou desagregados em análise conjunta, ou 
o uso de formulações especiais de variáveis para represen- 
tar efeitos não-lineares ou interativos em regressão. Em 
cada caso, essas questões resolvem detalhes específicos e 
finalizam a formulação do modelo e exigências para a co- 
leta de dados. 


Estágio 3: Avaliação das suposições 
inerentes à técnica multivariada 


Com os dados coletados, a primeira tarefa não é estimar o 
modelo multivariado, mas avaliar as suposições subjacen- 
tes. Todas as técnicas multivariadas têm suposições ine- 
rentes, tanto estatísticas quanto conceituais, que influen- 
ciam muito suas habilidades para representar relações 
multivariadas. Para as técnicas baseadas em inferência es- 
tatística, as suposições de normalidade multivariada, line- 
aridade, independência de termos de erro, e igualdade de 
variâncias em uma relação de dependência devem todas 
ser satisfeitas. A avaliação dessas suposições é discutida 
em maiores detalhes no Capítulo 2. Cada técnica também 
envolve uma série de suposições conceituais que lidam 
com questões como a formulação de modelo e os tipos de 
relações representadas. Antes que qualquer estimação de 
modelo seja tentada, o pesquisador deve garantir que as 
suposições estatísticas e conceituais estejam satisfeitas. 


Estágio 4: Estimação do modelo multivariado 
e avaliação do ajuste geral do modelo 


Com as suposições satisfeitas, a análise inicia a real esti- 
mação do modelo multivariado e uma avaliação do ajuste 
geral do modelo. No processo de estimação, o pesquisador 
pode escolher entre opções para atender características 
específicas dos dados (p. ex., uso de covariáveis estatísti- 
cas em MANOVA) ou maximizar o ajuste dos dados (p. 
ex., rotação de fatores ou funções discriminantes). Depois 
que o modelo é estimado, o seu ajuste geral é avaliado 
para estabelecer-se se atinge níveis aceitáveis sobre os cri- 
térios estatísticos (p. ex., nível de significância), se iden- 
tifica as relações propostas e se tem significância prática. 
Muitas vezes, o modelo é reespecificado, em uma tenta- 
tiva de atingir melhores níveis de ajuste e/ou explicação. 
Em todos os casos, contudo, um modelo aceitável deve 
ser obtido antes de se prosseguir. 

Não importa qual nível de ajuste geral do modelo seja 
conseguido, o pesquisador também deve determinar se 
os resultados são excessivamente afetados por alguma 
observação ou pequeno conjunto de observações que in- 
dique que os resultados podem ser instáveis ou não-gene- 


ralizáveis. Esses esforços garantem que os resultados são 
“robustos” e estáveis, aplicando-se razoavelmente bem a 
todas as observações na amostra. Observações de ajustes 
prejudiciais podem ser identificadas como observações 
atípicas, observações influentes ou resultados errôneos (p. 
ex., agrupamentos unitários ou casos muito mal classifica- 
dos em análise discriminante). 


Estágio 5: Interpretação da(s) 

variável(eis) estatística(s) 

Com um nível aceitável de ajuste do modelo, interpretar 
a(s) variável(eis) estatística(s) revela a natureza da re- 
lação multivariada. A interpretação de efeitos para va- 
riáveis individuais é feita examinando-se os coeficientes 
estimados (pesos) para cada variável na variável estatís- 
tica (p. ex., pesos de regressão, cargas fatoriais ou utili- 
dades conjuntas). Além disso, algumas técnicas também 
estimam múltiplas variáveis estatísticas que representam 
dimensões latentes de comparação ou associação (i.e., 
funções discriminantes ou componentes principais). A 
interpretação pode conduzir a reespecificações adicionais 
das variáveis e/ou da formulação do modelo, onde o mo- 
delo é reestimado e então novamente interpretado. O ob- 
jetivo é identificar evidência empírica de relações multiva- 
riadas nos dados da amostra que possam ser generalizadas 
para a população total. 


Estágio 6: Validação do modelo multivariado 


Antes de aceitar os resultados, o pesquisador deve sub- 
metê-los a um conjunto final de análises diagnósticas que 
avaliem o grau de generabilidade dos resultados pelos 
métodos de validação disponíveis. As tentativas de vali- 
dar o modelo são direcionadas no sentido de demonstrar 
a generalidade dos resultados para a população total (ver 
discussão anterior sobre técnicas de validação). Essas aná- 
lises diagnósticas acrescentam pouco à interpretação dos 
resultados, mas podem ser vistas como uma “garantia” de 
que os resultados são os melhores descritivos dos dados e 
ainda generalizáveis à população. 


Um fluxograma de decisão 


Para cada técnica multivariada, a abordagem de seis passos 
para a construção de modelos multivariados será retratada 
em um fluxograma de decisão dividido em duas seções. A 
primeira seção (estágios 1 a 3) lida com as questões rela- 
tivas à preparação para a estimação do modelo real (i.e., 
objetivos da pesquisa, considerações sobre planejamento 
da pesquisa, e teste das suposições). A segunda seção do 
fluxograma de decisão (estágios 4 a 6) trata dos aspectos 
pertinentes à estimação do modelo, interpretação e valida- 
ção. O fluxograma de decisão fornece ao pesquisador um 
método simplificado, mas sistemático, de uso da aborda- 
gem estrutural de construção do modelo multivariado em 
qualquer aplicação da técnica multivariada. 
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BASES DE DADOS 


Para melhor explicar e ilustrar cada técnica multivaria- 
da, usamos conjuntos de dados hipotéticos ao longo do 
livro. Os conjuntos de dados são para as Indústrias HBAT 
(HBAT), um fabricante de produtos de papel. Considera- 
se cada conjunto de dados como baseado em questionários 
preenchidos por clientes em um site seguro administrado 
por uma consagrada empresa de pesquisa de mercado. A 
companhia de pesquisa contata gerentes de compras e os 
encoraja a participarem. Para fazer isso, gerentes acessam 
o site e completam o questionário. Os conjuntos de dados 
são suplementados por outra informação compilada e ar- 
mazenada no banco de dados da HBAT e são acessíveis 
através de seu sistema de suporte de decisão. 


Base de dados primária 


A base de dados primária, consistindo de 100 observações 
sobre 18 variáveis separadas, é sustentada por um estudo 
de segmentação de mercado de clientes HBAT. A HBAT 
vende produtos de papel para dois segmentos do mercado: 
a indústria de jornais e a indústria de revistas. Além dis- 
so, os produtos de papel são vendidos a esses segmentos 
do mercado ou diretamente ao cliente, ou indiretamente 
via um intermediário. Dois tipos de informação foram co- 
letados nas pesquisas. O primeiro tipo foi sobre percep- 
ções de desempenho da HBAT sobre 13 atributos. Esses 
atributos, desenvolvidos através de grupos de foco, um 
pré-teste, e uso em estudos anteriores, são considerados 
os mais influentes na seleção de fornecedores na indústria 
de papel. Entre os respondentes havia gerentes de com- 
pras de firmas que compram da HBAT, e eles avaliaram a 
HBAT em cada um dos 13 atributos usando uma escala de 
0 a 10, com 10 sendo “excelente” e 0, “pobre”. O segundo 
tipo de informação se refere a resultados de compra e re- 
lações nos negócios (p. ex., satisfação com a HBAT ese a 
firma consideraria uma aliança/parceria estratégica com a 
HBAT). Um terceiro tipo de informação está disponível 
a partir dos dados da HBAT e inclui itens como tamanho 
do cliente e extensão da relação de compra. 

Analisando os dados, a HBAT pode desenvolver uma 
melhor compreensão das características de seus clientes e 
das relações entre suas percepções da HBAT e suas ações 
em relação à HBAT (p. ex., satisfação e probabilidade de 
recomendar). A partir dessa compreensão de seus clien- 
tes, a HBAT estará em uma boa posição para desenvol- 
ver seu plano de marketing para o próximo ano. Breves 
descrições das variáveis da base de dados são fornecidas 
na Tabela 1-3, na qual as variáveis são classificadas como 
independentes ou dependentes, e métricas ou não-métri- 
cas. Além disso, uma lista completa e uma cópia eletrôni- 
ca da base de dados estão disponíveis na Web em www. 
bookman.com.br. Uma definição de cada variável e uma 
explicação de sua codificação são dadas nas seções que se 
seguem. 


Variáveis de classificação do banco de dados 

Como respondentes foram selecionados para a amostra 
a ser usada pela empresa de pesquisa de marketing, cin- 
co variáveis foram também extraídas do banco de dados 
HBAT para refletir as características básicas da firma e 
sua relação de negócios com a HBAT. As cinco variá- 
veis são: 


X, Tipo de cliente Período de tempo em que 


um dado cliente tem 
comprado da HBAT: 
1=menos de um ano 
2=entre le 5 anos 
3 = mais do que 5 anos 
Tipo de indústria que 
compra os produtos de 
papel da HBAT: 
O = indústria de revistas 
1 = indústria de jornais 
X, Tamanho da firma Quantia de empregados: 
0= empresa pequena, 
menos de 500 
empregados 


1 = empresa grande, 500 
ou mais empregados 


X, Tipo de indústria 


X, Região Local do cliente: 
0= EUA/América do 
Norte 
1=fora da América do 
Norte 


X, Sistema de 
distribuição 


Como os produtos de papel 
são vendidos para clientes: 
O = vendidos 
indiretamente 
através de um 
intermediário 
1= vendidos 
diretamente 


Percepções de HBAT 

As percepções sobre HBAT de cada cliente em um con- 
junto de funções de negócios foram medidas em uma esca- 
la gráfica de avaliação, onde uma linha de 10 centímetros 
foi desenhada entre os extremos chamados de “Pobre” e 
“Excelente”. 


Pobre Excelente 


Como parte da pesquisa, os respondentes indicaram 
suas percepções fazendo uma marca em algum ponto da 
linha. A posição da marca era eletronicamente observada, 
e a distância a partir de O (em centímetros) era gravada 
na base de dados para aquela pesquisa em particular. O 
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resultado foi uma variação de escala de O a 10, arredon- X, Linha de produto Profundidade e amplitude 
dada em uma única casa decimal. Os 13 atributos HBAT 
avaliados pelos respondentes foram: 


X 


X, 


Qualidade do Nível percebido de 


produto qualidade dos produtos de X Imagem da força 
papel HBAT de venda o 
Atividades de Imagem geral do Web site X Preço competitivo 
comércio da HBAT, especialmente 
eletrônico/ a facilidade de uso 
Web site X, Garantia e 
Suporte técnico | Grau em que o apoio reclamações 
técnico é oferecido para 
ajudar em questões sobre 
produto/serviços Xi — Novos produtos 
Solução de Grau em que as 
reclamação reclamações são resolvidas 
em termos de prazo e Xe — Encomenda e 
eficiência cobrança 
Anúncio Percepções sobre as 
campanhas de anúncios da 
HBAT em todos os tipos 
de mídia 


TABELA 1-3 Descrição de variáveis da base de dados 


da linha de produtos da 
HBAT para atender às 
necessidades dos clientes 
Imagem geral da força de 
venda da HBAT 

Grau em que a 

HBAT oferece preços 
competitivos 

Grau em que a HBAT 
atua diante das garantias 
e reclamações sobre 
produtos e serviços 

Grau em que a HBAT 
desenvolve e vende novos 
produtos 

Percepções de que 
encomenda e cobrança são 
lidadas com eficiência e 
corretamente 


Descrição da variável 


Tipo de variável 


Variáveis de classificação do banco de dados 


Tipo de cliente 

Tipo de indústria 
Tamanho da firma 
Região 

Sistema de distribuição 


xXx 


Variáveis de percepções de desempenho 


Qualidade do produto 
Atividades de comércio eletrônicoAVeb site 
Suporte técnico 

Solução de reclamação 

ê Anúncio 

F Linha de produto 

Imagem da equipe de venda 
Preço competitivo 

Garantia e reclamações 

E Novos produtos 

6 Encomenda e cobrança 
Flexibilidade de preço 

8 Velocidade de entrega 


[2 


E 


q 


XXX X xXx xx xx x x x 


Medidas de resultado/relação 


Kg Satisfação 

o Probabilidade de recomendação 

1 Probabilidade de futura compra 

2 Atual nível de compra/uso 

3 Considerar aliança/parceria estratégica no futuro 


não-métrica 
não-métrica 
não-métrica 
não-métrica 
não-métrica 


métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 
métrica 


métrica 
métrica 
métrica 
métrica 
não-métrica 
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X, Flexibilidade 
de preço 


Percepção sobre a 
disposição dos 
representantes de vendas 
da HBAT para negociar 
preços nas compras de 
produtos de papel 
Tempo de demora para a 
entrega de produtos 

de papel uma vez que 

a encomenda seja 
confirmada. 


X, Velocidade de 
entrega 


Resultados de compras 

Foram obtidas cinco medidas específicas que refletem os 
resultados das relações de compras do respondente com a 
HBAT. Essas medidas incluem as seguintes: 


X,o Satisfação do 
cliente 


Satisfação do cliente com 
as últimas compras feitas 
na HBAT, medida em uma 
escala gráfica de 10 pontos. 


Probabilidade de 
recomendar a HBAT para 
outras empresas como 
fornecedor de produtos 
de papel, medida em uma 
escala de 10 pontos. 


X,y Probabilidade 
de recomendar 
a HBAT 


X, Probabilidade Probabilidade de 
de futuras futuramente comprar 
compras da produtos de papel da 
HBAT HBAT, medida em uma 


escala de 10 pontos. 
Percentual das necessidades 
da firma respondente 

de compras da HBAT, 
medido em uma escala 
percentual de 100 pontos. 
Grau em que o cliente/ 
respondente vê a si mesmo 
em parceria/aliança com a 
HBAT: 


0 =não consideraria 


X, Percentual de 
compras 
da HBAT 


Xw Percepção de 
futura relação 
com a HBAT 


1=sim, consideraria 
aliança ou parceria 
estratégica 


Outras bases de dados 


Outras cinco bases de dados especializadas são emprega- 
das no texto. Primeiro, o Capítulo 6 usa uma versão ex- 
pandida da base de dados HBAT contendo 200 respon- 
dentes (HBAT200) que fornece tamanhos de amostras 
suficientes para análises MANOVA mais complexas. O 
Capítulo 2 utiliza uma base de dados menor de muitas 
dessas variáveis obtidas em algumas pesquisas. O objetivo 


é ilustrar a identificação de observações atípicas, o manu- 
seio de dados perdidos e o teste de suposições estatísticas. 
O Capítulo 9 sobre MDS e análise de correspondência e 
os capítulos SEM (10, 11 e 12) usam bases de dados distin- 
tas que atendem às exigências específicas daquelas técni- 
cas. Em cada caso, a base de dados é descrita de maneira 
mais completa naqueles capítulos. Uma listagem completa 
dessas bases de dados é dada em www.bookman.com.br. 


ORGANIZAÇÃO DOS 
DEMAIS CAPÍTULOS 


Os outros capítulos do texto são organizados em cinco se- 
ções; cada uma aborda um estágio separado para executar 
uma análise multivariada. 


Seção I: Preparação para uma 
análise multivariada 


A seção inicial lida com questões que devem ser resolvidas 
antes que uma análise multivariada possa ser aplicada. Essa 
seção começa com o Capítulo 2, o qual cobre os tópicos de 
acomodação de dados perdidos, a garantia de atender as 
suposições estatísticas inerentes, e a identificação de obser- 
vações atípicas que poderiam influenciar desproporcional- 
mente os resultados. O Capítulo 3 cobre a análise fatorial, 
uma técnica particularmente adequada para examinar as 
relações entre variáveis e as oportunidades de criar escalas 
múltiplas. Esses dois capítulos se combinam para fornecer 
ao pesquisador não apenas as ferramentas diagnósticas ne- 
cessárias para preparar os dados para análise, mas também 
os meios para redução de dados e construção de escala que 
podem ser incluídos em outras técnicas multivariadas. 


Seção II: Técnicas de dependência 


Essa seção trata de quatro técnicas de dependência — re- 
gressão múltipla (Capítulo 4), análise discriminante (Ca- 
pítulo 5), análise multivariada de variância (Capítulo 6) e 
análise conjunta (Capítulo 7). Como observado anterior- 
mente, as técnicas de dependência permitem ao pesquisa- 
dor avaliar o grau de relação entre as variáveis dependen- 
tes e independentes. As técnicas de dependência variam 
no tipo e caráter da relação, o que se reflete nas proprieda- 
des de medida das variáveis dependentes e independentes. 
Cada técnica é examinada sob sua perspectiva única de 
avaliar uma relação de dependência e sua habilidade de 
tratar com um tipo particular de objetivo de pesquisa. 


Seção II: Técnicas de interdependência 


Dois capítulos (Capítulos 8 e 9) cobrem as técnicas de 
análise de agrupamentos e mapeamento perceptual. Es- 
sas técnicas apresentam ao pesquisador ferramentas par- 
ticularmente adequadas para avaliar estruturas, focali- 
zando-se na descrição das relações entre objetos, sejam 
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respondentes (análise de agrupamentos) ou objetos como 
empresas, produtos e assim por diante (mapeamento per- 
ceptual). Deve-se notar que uma das técnicas primárias de 
interdependência, análise fatorial, e sua habilidade para 
avaliar a relação entre variáveis, é abordada na Seção 1. 


Seção IV: Para além do básico 


Essa seção apresenta ao pesquisador uma técnica multi- 
variada avançada amplamente usada, a saber, modelagem 
de equações estruturais. O Capítulo 10 fornece uma visão 
geral da modelagem de equações estruturais, concentran- 
do-se na aplicação de um processo de decisão em análises 
SEM. Os Capítulos 11 e 12 estendem a discussão SEM 
para as duas aplicações mais amplamente usadas: análise 
fatorial confirmatória (CFA, confirmatory factor analysis) 
e modelagem estrutural. 


Resumo 


Análise multivariada de dados é uma poderosa ferramen- 
ta para pesquisadores. A aplicação apropriada dessas téc- 
nicas revela relações que em outras situações não seriam 
identificadas. Este capítulo introduz o leitor aos principais 
conceitos e o ajuda a fazer o seguinte: 


Explicar o que é análise multivariada e quando seu uso é 
adequado. Técnicas de análise multivariada são popula- 
res porque viabilizam a organizações a criar conhecimen- 
to e assim melhorar suas tomadas de decisões. A análise 
multivariada se refere a todas as técnicas estatísticas que 
simultaneamente analisam múltiplas medidas sobre indiví- 
duos ou objetos sob investigação. Desse modo, quaisquer 
análises simultâneas de mais do que duas variáveis podem 
ser consideradas como análises multivariadas. 

Alguma confusão pode surgir sobre o que é análise 
multivariada, pois o termo não é empregado consistente- 
mente na literatura. Alguns pesquisadores usam o termo 
multivariada simplesmente para se referir ao exame de 
relações entre duas ou mais variáveis. Outros utilizam o 
termo apenas para problemas nos quais todas as múlti- 
plas variáveis são assumidas como tendo uma distribuição 
normal multivariada. Neste livro, não insistimos em uma 
definição rígida de análise multivariada. No lugar disso, a 
análise multivariada inclui técnicas de múltiplas variáveis, 
bem como técnicas verdadeiramente multivariadas, pois 
acreditamos que o conhecimento de técnicas de múltiplas 
variáveis é um primeiro passo essencial na compreensão 
da análise multivariada. 


Discutir a natureza das escalas de medida e sua relação 
com técnicas multivariadas. A análise de dados envolve 
a identificação e medida de variação em um conjunto de 
variáveis, seja entre elas mesmas, seja entre uma variável 
dependente e uma ou mais variáveis independentes. A 
palavra-chave aqui é medida, porque o pesquisador não 
pode identificar variação a menos que ela possa ser me- 


dida. Medida é importante na representação precisa dos 
conceitos de pesquisa sendo estudados e é instrumental 
na escolha do método multivariado de análise adequado. 
Dados podem ser classificados em uma entre duas cate- 
gorias — não-métricos (qualitativos) e métricos (quantita- 
tivos) — com base nos tipos de atributos ou característi- 
cas que eles representam. O pesquisador deve definir o 
tipo de medida para cada variável. Para o computador, os 
valores são apenas números. A questão de dados serem 
métricos ou não-métricos afeta o que os mesmos podem 
representar, como podem ser analisados e as técnicas mul- 
tivariadas adequadas para uso. 


Entender a natureza do erro de medida e seu impacto 
sobre a análise multivariada. O emprego de múltiplas 
variáveis e a confiança em suas combinações (a variável 
estatística) em métodos multivariados concentra atenção 
em um tópico complementar: erro de medida. Erro de 
medida é o grau em que os valores observados não são 
representativos dos valores “verdadeiros”. Erro de me- 
dida tem muitas fontes, variando de erros na entrada de 
dados até a imprecisão da medida e a falta de habilidade 
dos respondentes em fornecer informações precisas. As- 
sim, todas as variáveis usadas em técnicas multivariadas 
devem ser consideradas como tendo algum grau de erro 
de medida. Quando variáveis com erro de medida são em- 
pregadas para computar correlações ou médias, o “ver- 
dadeiro” efeito é parcialmente mascarado pelo erro de 
medida, fazendo com que as correlações se enfraqueçam 
e as médias sejam menos precisas. 


Determinar qual técnica multivariada é adequada para um 
problema específico de pesquisa. As técnicas multivaria- 
das podem ser classificadas com base em três julgamentos 
que o pesquisador deve fazer sobre o objetivo da pesquisa 
e a natureza dos dados: (1) as variáveis podem ser divi- 
didas em independentes e dependentes tomando-se por 
base alguma teoria? (2) Se podem, quantas variáveis são 
tratadas como dependentes em uma única análise?, e (3) 
como são medidas tanto as variáveis dependentes quanto 
as independentes? A seleção da técnica multivariada ade- 
quada depende das respostas a essas três perguntas. 


Definir as técnicas específicas incluídas em análise multi- 
variada. Análise multivariada é um conjunto de técnicas 
em contínuo desenvolvimento para a análise de dados e 
que engloba um vasto domínio de possíveis situações de 
pesquisa. Entre as técnicas mais consagradas e emergen- 
tes estão a análise de componentes principais e a análise 
dos fatores comuns, regressão múltipla e correlação múl- 
tipla, análise discriminante múltipla e regressão logística, 
análise de correlação canônica, análise multivariada de 
variância e covariância, análise conjunta, análise de agru- 
pamentos, mapeamento perceptual, também conhecido 
como escalonamento multidimensional, análise de corres- 
pondência, e modelagem de equações estruturais (SEM), 
que inclui a análise fatorial confirmatória. 
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Discutir as diretrizes para aplicação e interpretação de aná- 
lises multivariadas. A análise multivariada tem poderosas 
capacidades analíticas e preditivas. O poder de acomodar 
múltiplas variáveis e relações cria substancial complexidade 
nos resultados e suas interpretações. Diante dessa comple- 
xidade, o pesquisador é advertido a usar métodos multiva- 
riados somente quando foi desenvolvida a exigida funda- 
mentação conceitual para apoiar a técnica selecionada. As 
seguintes orientações representam uma “filosofia da análise 
multivariada” que deveria ser seguida em sua aplicação: 


1. Estabelecer significância prática, bem como significância es- 
tatística. 

Reconhecer que tamanhos de amostras afetam resultados. 
Conhecer seus dados. 

Esforçar-se por modelos parcimoniosos. 

Examinar seus erros. 

Validar seus resultados. 


ER TA ca rd di 


Compreender o tratamento em seis etapas para a constru- 
ção de modelo multivariado. O processo de seis etapas 
para a construção de modelo fornece uma estrutura para 
desenvolver, interpretar e validar qualquer análise multi- 
variada. 


1. Definir o problema de pesquisa, os objetivos e a técnica 
multivariada a ser usada. 

Desenvolver o plano de análise. 

Avaliar as suposições. 

Estimar o modelo multivariado e avaliar o ajuste. 
Interpretar as variáveis estatísticas. 

Validar o modelo multivariado. 


a a pn 


Este capítulo introduziu o excitante e desafiador tópi- 
co da análise multivariada de dados. Os capítulos a seguir 
discutem cada uma dessas técnicas em detalhes suficientes 
para viabilizar ao pesquisador iniciante a compreensão 
sobre o que uma técnica em particular pode conseguir, 
quando e como ela deve ser aplicada, e como os resulta- 
dos dessa aplicação devem ser interpretados. 


Questões 


1. Defina análise multivariada com suas próprias palavras. 

2. Liste os fatores mais importantes que contribuem para a 
crescente aplicação de técnicas para a análise multivariada 
de dados na última década. 


3. Liste e descreva as técnicas de análise multivariada de da- 
dos descritas neste capítulo. Cite exemplos nos quais cada 
técnica se mostre adequada. 

4. Explique por que e como os vários métodos multivariados 
podem ser vistos como uma família de técnicas. 

5. Por que o conhecimento de escalas de medida é importante 
para um entendimento da análise multivariada de dados? 

6. Quais são as diferenças entre significância estatística e práti- 
ca? Uma é pré-requisito da outra? 

7. Quais são as implicações do baixo poder estatístico? Como o 
poder pode ser melhorado se for considerado muito baixo? 

8. Detalhe o processo de construção de modelos para a análise 
multivariada, concentrando-se nas principais questões em 
cada passo. 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustram aspectos e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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SEÇÃO 


Preparação para uma Análise Multivariada 


VISÃO GERAL 


A Seção | fornece um conjunto de ferramentas e análises que 
ajudam a preparar o pesquisador para a complexidade cres- 
cente de uma análise multivariada. O pesquisador prudente 
compreende a necessidade de um maior nível de compreen- 
são dos dados, tanto em termos estatísticos quanto concei- 
tuais. Apesar de as técnicas multivariadas discutidas neste 
texto apresentarem ao pesquisador um poderoso conjunto de 
ferramentas analíticas, elas também representam o risco de 
posteriormente distanciar o pesquisador de um entendimento 
sólido dos dados e de o conduzir à noção equivocada de que 
as análises apresentam um meio “rápido e fácil” para identi- 
ficar relações. À medida que o pesquisador confia mais ce- 
gamente nessas técnicas para encontrar a resposta e menos 
em uma base e entendimento conceituais das propriedades 
fundamentais dos dados, aumenta o risco de problemas sé- 
rios no uso indevido de técnicas, na violação de propriedades 
estatísticas, ou na inferência e interpretação inadequadas dos 
resultados. Esses riscos jamais podem ser totalmente elimi- 
nados, mas as ferramentas e análises discutidas nesta seção 
melhorarão a habilidade do pesquisador para reconhecer 
muitos desses problemas, quando eles ocorrem, e aplicar as 
medidas corretivas apropriadas. 


CAPÍTULOS NA SEÇÃO | 


Esta seção começa com o Capítulo 2, Exame de seus Dados, 
o qual cobre os tópicos de acomodação de dados perdidos, 
atendimento das suposições estatísticas inerentes, e identi- 
ficação de observações atípicas que podem influenciar os 
resultados de maneira desproporcional. Essas análises forne- 
cem simples avaliações empíricas que detalham as proprie- 
dades estatísticas críticas dos dados. O Capítulo 3, Análise 
Fatorial, apresenta uma discussão de uma técnica de inter- 
dependência particularmente adequada para examinar as 
relações entre variáveis e a criação de escalas múltiplas. A 
“busca por estrutura” com a análise fatorial pode revelar inter- 
relações substanciais entre variáveis e fornecer uma base ob- 
jetiva para o desenvolvimento do modelo conceitual e uma 
melhor parcimônia entre as variáveis em uma análise multiva- 
riada. Assim, os dois capítulos desta seção se harmonizam 
para fornecer ao pesquisador não apenas as ferramentas 
diagnósticas necessárias à preparação de dados para análi- 
se, mas também os meios para redução de dados e constru- 
ção de escala que podem melhorar consideravelmente outras 
técnicas multivariadas. 


CAPÍTULO 


Exame de seus Dados 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


= Selecionar o método gráfico apropriado para examinar as características dos dados ou 
relações de interesse. 


Avaliar o tipo e o potencial impacto de dados perdidos. 

Compreender os diferentes tipos de processos de dados perdidos. 

Explicar as vantagens e desvantagens das abordagens disponíveis para lidar com dados 
perdidos. 

Identificar observações atípicas univariadas, bivariadas e multivariadas. 

Testar seus dados para as suposições subjacentes à maioria das técnicas multivariadas. 
Determinar o melhor método de transformação de dados, dado um problema específico. 
Compreender como incorporar variáveis não-métricas como variáveis métricas. 


Apresentação do capítulo 


Exame de dados é um passo inicial que consome tempo, mas necessário, que às vezes é ignorado 
por pesquisadores. Aqui o pesquisador avalia o impacto de dados perdidos, identifica observações 
atípicas e testa suposições inerentes à maioria das técnicas multivariadas. O objetivo dessas tarefas 
de exame de dados é muito mais no sentido de revelar o que não é aparente do que retratar os dados 
reais, pois os efeitos “ocultos” são facilmente despercebidos. Por exemplo, os vieses introduzidos por 
dados perdidos não-aleatórios jamais serão conhecidos a não ser que sejam explicitamente identifi- 
cados e remediados pelos métodos discutidos em uma seção posterior deste capítulo. Além disso, a 
menos que o pesquisador reveja os resultados com base em uma análise caso a caso, a existência de 
observações atípicas não será aparente, mesmo quando elas afetam substancialmente os resultados. 
Violações da suposição estatística podem provocar vieses ou não-significância nos resultados que não 
podem ser distinguidos dos resultados verdadeiros. 

Antes de discutirmos uma série de ferramentas empíricas para ajudar no exame de dados, a seção 
introdutória deste capítulo oferece um resumo de várias técnicas gráficas disponíveis ao pesquisador 
como um meio de representar dados. Essas técnicas fornecem ao pesquisador um conjunto de maneiras 
simples, ainda que abrangentes, para examinar tanto as variáveis individuais quanto as relações entre 
elas. As técnicas gráficas não são destinadas como substitutivas das ferramentas empíricas, mas, ao 
invés disso, como um meio complementar para retratar os dados e suas relações. Como o leitor verá, um 
histograma pode mostrar graficamente o formato da distribuição de dados, exatamente como podemos 
refletir a mesma distribuição com valores de assimetria e curtose. As medidas empíricas quantificam as 
características da distribuição, enquanto o histograma as retrata de uma maneira simples e visual. Ana- 
logamente, outras técnicas gráficas (i.e., gráficos de dispersão e de caixas) mostram relações entre va- 
riáveis representadas pelo coeficiente de correlação e teste de diferenças de médias, respectivamente. 

Com as técnicas gráficas abordadas, a próxima tarefa a ser encarada pelo pesquisador é como ava- 
liar e superar armadilhas resultantes do delineamento de pesquisa (p. ex., elaboração de questionário) e 
práticas de coleta de dados. Especificamente, este capítulo trata do que se segue: 
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e Avaliação de dados perdidos 
e Identificação de observações atípicas 
e Teste das suposições inerentes à maioria das técnicas multivariadas 


Dados perdidos são um incômodo para pesquisadores e principalmente resultam de erros na co- 
leta ou entrada de dados, ou da omissão de respostas pelos respondentes. A classificação de dados 
perdidos e as razões por trás de sua presença são abordadas através de uma série de passos que não 
somente identificam os impactos de dados perdidos, mas fornecem soluções para lidar com eles na 
análise. Observações atípicas ou respostas extremas podem influenciar de maneira a invalidar o resul- 
tado de qualquer análise multivariada. Por essa razão, métodos para avaliar o impacto das mesmas são 
discutidos. Finalmente, as suposições estatísticas inerentes à maioria das análises multivariadas são 
revistas. Antes de aplicar qualquer técnica multivariada, o pesquisador deve avaliar o ajuste dos dados 
da amostra com as suposições estatísticas subjacentes aquela técnica multivariada. Por exemplo, pes- 
quisadores que querem aplicar análise de regressão (Capítulo 4) estariam particularmente interessados 
em avaliar as suposições de normalidade, homocedasticidade, independência de erro e linearidade. 
Cada um desses requisitos deve ser tratado de alguma forma para cada técnica multivariada. 

Além disso, este capítulo introduz o pesquisador a métodos para incorporação de variáveis não- 
métricas em aplicações que requerem variáveis métricas por meio da criação de um tipo especial de 
variável métrica conhecida como dicotômica. A aplicabilidade de variáveis dicotômicas varia conforme 


cada projeto de análise de dados. 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 
pontos que merecem destaque e as referências cruzadas nos 
termos-chave estão em itálico. Exemplos ilustrativos apare- 
cem em quadros. 


Abordagem de caso completo Tratamento para lidar com da- 
dos perdidos que computa valores com base em dados so- 
mente de casos completos, ou seja, casos sem dados perdi- 
dos. Também conhecido como método por listagem. 

Abordagem de disponibilidade Método de atribuição para da- 
dos perdidos que computa valores com base em todas as 
observações válidas disponíveis, também conhecido como 
método aos pares. 

Assimetria Medida da simetria de uma distribuição; na maioria 
dos casos, a comparação é feita com uma distribuição normal. 
Uma distribuição positivamente assimétrica tem relativamente 
poucos valores grandes e uma cauda mais alongada à direi- 
ta, e uma distribuição negativamente assimétrica tem relativa- 
mente poucos valores pequenos e uma cauda mais alongada 
à esquerda. Valores assimétricos fora do intervalo —1 a +1 indi- 
cam uma distribuição substancialmente assimétrica. 

Categoria de referência A categoria de uma variável não-métri- 
ca que é omitida quando se criam variáveis dicotômicas e atua 
como ponto de referência na interpretação das variáveis dico- 
tômicas. Na codificação indicadora, a categoria de referência 
tem valores zero (0) para todas as variáveis dicotômicas. Com 
codificação de efeitos, a categoria de referência tem valores 
de menos um (-1) para todas as variáveis dicotômicas. 

Codificação de efeitos Método para especificar a categoria de 
referência para um conjunto de variáveis dicotômicas, sendo 
que a categoria de referência recebe um valor de menos um 
(-1) sobre o conjunto de variáveis dicotômicas. Com esse tipo 
de codificação, os coeficientes da variável dicotômica repre- 


sentam desvios do grupo em relação à média de todos os 
grupos, o que contrasta com codificação indicadora. 

Codificação indicadora Método para especificar a categoria de 
referência para um conjunto de variáveis dicotômicas onde a 
categoria de referência recebe um valor O ao longo do conjun- 
to de variáveis dicotômicas. Os coeficientes das variáveis di- 
cotômicas representam as diferenças de categoria em relação 
à categoria de referência. Ver também codificação de efeitos. 

Completamente perdidos ao acaso (MCAR — missing comple- 
tely at random) Classificação de dados perdidos aplicável 
quando valores perdidos de Y não dependem de X. Quando 
os dados perdidos são MCAR, os valores observados de Y 
são uma amostra verdadeiramente aleatória de todos os va- 
lores de Y, sem um processo inerente que induza vieses aos 
dados observados. 

Curtose Medida da elevação ou do achatamento de uma distribui- 
ção quando comparada com uma distribuição normal. Um valor 
positivo indica uma distribuição relativamente elevada, e um va- 
lor negativo indica uma distribuição relativamente achatada. 

Dados censurados Observações que são incompletas de uma 
maneira sistemática e conhecida. Um exemplo ocorre no es- 
tudo de causas de morte em uma amostra na qual alguns 
indivíduos ainda estão vivos. Os dados censurados são um 
exemplo de dados perdidos ignoráveis. 

Dados perdidos ignoráveis Processo de dados perdidos que 
é explicitamente identificável e/ou está sob o controle do 
pesquisador. Os dados perdidos ignoráveis não demandam 
ações corretivas, pois os dados perdidos são explicitamente 
tratados na técnica empregada. 

Dados perdidos Informação não-disponível de um indivíduo (ou 
caso) sobre o qual outra informação está disponível. Os dados 
perdidos frequentemente ocorrem quando um respondente 
deixa de responder uma ou mais questões em uma pesquisa. 

Diagrama de dispersão Representação da relação entre duas 
variáveis métricas que descreve os valores conjuntos de cada 
observação em um gráfico bidimensional. 
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Diagrama de ramo-e-folhas Uma variante do histograma que 
fornece uma descrição visual da distribuição de variável, bem 
como uma enumeração dos valores reais dos dados. 

Distribuição normal Distribuição contínua de probabilidade pu- 
ramente teórica na qual o eixo horizontal representa todos os 
valores possíveis de uma variável e o eixo vertical representa 
a probabilidade de esses valores ocorrerem. Os valores sobre 
a variável estão agrupados em torno da média em um padrão 
simétrico, unimodal, conhecido como curva normal, ou forma 
de sino. 

Gráfico de probabilidade normal Comparação gráfica da for- 
ma da distribuição com a distribuição normal. Na representa- 
ção gráfica da probabilidade normal, a distribuição é repre- 
sentada por uma reta inclinada em 45 graus. A distribuição 
real é comparada com essa reta de maneira que diferenças 
são mostradas como desvios da reta, tornando a identificação 
de diferenças bastante visível e interpretável. 

Gráficos de caixas (boxplot) Método para representar a distri- 
buição de uma variável. Uma caixa representa a maior par- 
te da distribuição, e as extensões — chamadas de whiskers 
— atingem os pontos extremos da distribuição. Muito útil para 
fazer comparações de uma ou mais variáveis em grupos. 

Grupo de comparação Ver categoria de referência. 

Heteroscedasticidade Ver homocedasticidade. 

Histograma epresentação gráfica da distribuição de uma única 
variável. Ao fazer contagem de frequência em categorias, a 
forma da distribuição da variável pode ser mostrada. Usado 
para fazer uma comparação visual com a distribuição normal. 

Homocedasticidade Quando a variância dos termos de erro (e) 
parece constante ao longo de um domínio de variáveis predi- 
toras, diz-se que os dados são homoscedásticos. A suposição 
de variância igual do erro E da população (onde E é estimado 
a partir de e) é crítica para a aplicação correta de muitas téc- 
nicas multivariadas. Quando os termos de erro têm variância 
crescente ou flutuante, diz-se que os dados são heteroscedás- 
ticos. A análise de resíduos ilustra melhor esse ponto. 

Linearidade Usada para expressar o conceito de que o mode- 
lo possui as propriedades de aditividade e homogeneidade. 
Em termos gerais, os modelos lineares prevêem valores que 
recaem em uma linha reta que tem uma mudança com unida- 
de constante (coeficiente angular) da variável dependente em 
relação a uma mudança com unidade constante da variável 
independente. No modelo de população Y= b,+ bX, +e,0 
efeito de uma mudança de 1 em X, deve acrescentar b, (uma 
constante) unidades em Y, 

Métodos de atribuição Processo de estimação dos dados per- 
didos de uma observação baseado em valores válidos das 
outras variáveis. O objetivo é empregar relações conhecidas 
que possam ser identificadas nos valores válidos da amostra 
para auxiliar na representação ou mesmo na estimação das 
substituições para valores perdidos. 

Normalidade Grau em que a distribuição dos dados da amostra 
corresponde a uma distribuição normal. 

Observação atípica Uma observação que é substancialmente 
diferente das outras (i.e., tem um valor extremo) em uma ou 
mais características (variáveis). O mais importante é a sua re- 
presentatividade da população. 


Perdidos ao acaso (MAR — missing at random) Classificação 


de dados perdidos aplicável quando valores perdidos de Y 
dependem de X, mas não de Y. Quando dados perdidos são 
MAR, dados observados para Y são uma amostra verdadei- 
ramente aleatória para os valores de X na amostra, mas não 
uma amostra aleatória de todos os valores de Y devido a va- 
lores perdidos de X. 


Processo de dados perdidos Qualquer evento sistemático ex- 


terno ao respondente (como erros na entrada de dados ou 
problemas na coleta de dados) ou qualquer ação por parte do 
respondente (como a recusa a responder uma questão) que 
conduz a dados perdidos. 


Representação gráfica multivariada Método para apresen- 


tação de um perfil multivariado de uma observação em três 
ou mais variáveis. Os métodos incluem procedimentos como 
glifos, transformações matemáticas e até mesmo representa- 
ções iconográficas (p. ex., faces). 


Resíduo Parte de uma variável dependente não explicada por 


uma técnica multivariada. Associado a métodos de depen- 
dência que tentam prever a variável dependente, o resíduo re- 
presenta a parte inexplicada da mesma. Os resíduos podem 
ser usados em procedimentos diagnósticos para identificar 
problemas na técnica de estimação ou para identificar rela- 
ções não-especificadas. 


Robustez A habilidade de uma técnica estatística de desempe- 


nhar razoavelmente bem mesmo quando as suposições esta- 
tísticas inerentes foram de algum modo violadas. 


Transformações de dados Uma variável pode ter uma carac- 


terística indesejável, como não-normalidade, que diminui seu 
uso em uma técnica multivariada. Uma transformação, como 
o logaritmo ou a raiz quadrada da variável, cria uma variável 
transformada que é mais adequada para descrever a relação. 
As transformações podem ser aplicadas em variáveis depen- 
dentes, independentes ou ambas. A necessidade e o tipo es- 
pecífico de transformação podem ser baseados em razões 
teóricas (p. ex., transformar uma relação não-linear conheci- 
da) ou razões empíricas (p. ex., problemas identificados por 
meios gráficos ou estatísticos). 


Variável dicotômica Variável métrica especial usada para re- 


presentar uma única categoria de uma variável não-métrica. 
Para dar conta de L níveis de uma variável não-métrica, L — 
1 variáveis dicotômicas são necessárias. Por exemplo, sexo 
é medido como masculino ou feminino e poderia ser repre- 
sentado por duas variáveis dicotômicas (X, e X,). Quando o 
respondente é do sexo masculino, X, = 1 e X, = O. Do mesmo 
modo, quando o respondente é do sexo feminino, X, = 0 e 
X = 1. No entanto, quando X, = 1, sabemos que X, deve ser 
igual a O. Logo, precisamos de apenas uma variável, X, ou X,, 
para representar a variável sexo. Se uma variável não-métrica 
tem três níveis, apenas duas variáveis dicotômicas são neces- 
sárias. Sempre temos uma variável dicotômica a menos do 
que o número de níveis para a variável não-métrica. A catego- 
ria omitida é chamada de categoria de referência. 


Variável estatística Combinação linear de variáveis formada 


na técnica multivariada por meio da determinação de pesos 
empíricos aplicados a um conjunto de variáveis especificadas 
pelo pesquisador. 
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INTRODUÇÃO 


As tarefas envolvidas no exame de seus dados podem pa- 
recer comuns e inconsegientes, mas são uma parte essen- 
cial de qualquer análise multivariada. As técnicas multi- 
variadas colocam um tremendo poder analítico nas mãos 
do pesquisador. Mas também colocam maior responsabi- 
lidade sobre o pesquisador para garantir que a estrutu- 
ra estatística e teórica na qual se baseiam também está 
sustentada. Ao examinar os dados antes da aplicação de 
qualquer técnica multivariada, o pesquisador passa a ter 
uma visão crítica das características dos dados. 


e Primeiro e mais importante, o pesquisador conquista uma 
compreensão básica dos dados e das relações entre variá- 
veis. As técnicas multivariadas impõem grandes exigências 
ao pesquisador para entender, interpretar e articular resul- 
tados com base em relações que são mais complexas do que 
anteriormente percebido. O conhecimento das inter-rela- 
ções de variáveis pode ajudar incrivelmente na especifica- 
ção e no refinamento do modelo multivariado, bem como 
fornecer uma perspectiva racional para a interpretação dos 
resultados. 

e Segundo, o pesquisador garante que os dados inerentes à 
análise atendem todas as exigências para uma análise mul- 
tivariada. As técnicas multivariadas demandam muito mais 
dos dados em termos de maiores conjuntos de dados e su- 
posições mais complexas do que aquilo que se encontra na 
análise univariada. Dados perdidos, observações atípicas e 
as características estatísticas dos dados são muito mais difí- 
ceis de avaliar em um contexto multivariado. Assim, a sofis- 
ticação analítica necessária para garantir que essas exigên- 
cias sejam atendidas tem forçado o pesquisador a empregar 
uma série de técnicas de exame de dados tão complexas 
quanto as próprias técnicas multivariadas. 


Tanto os pesquisadores iniciantes quanto os expe- 
rientes podem ser tentados a ler superficialmente ou 
mesmo pular este capítulo para despender mais tempo 
com as técnicas multivariadas. O tempo, o esforço e os 
recursos dedicados ao processo de exame de dados po- 
dem parecer quase desperdiçados, pelo fato de que mui- 
tas vezes nenhuma ação corretiva é garantida. Porém, 
o pesquisador deve ver essas técnicas como “investi- 
mentos em seguro multivariado” que garantem que os 
resultados obtidos a partir da análise multivariada são 
verdadeiramente válidos e precisos. Sem este “investi- 
mento” é muito fácil, por exemplo, que diversas observa- 
ções atípicas não-identificadas perturbem os resultados, 
que dados perdidos introduzam um viés nas correlações 
entre variáveis ou que variáveis não-normais invalidem 
os resultados. Mas o aspecto mais problemático dessas 
questões é o fato de serem “ocultas”, pois na maioria dos 
casos as técnicas multivariadas seguirão adiante e forne- 
cerão resultados. Somente se o pesquisador “investiu”, 
o potencial dos problemas catastróficos será reconheci- 
do e corrigido antes que a análise seja executada. Esses 
problemas podem ser evitados seguindo-se essas análi- 


ses toda vez que uma técnica multivariada é usada. Esses 
esforços irão mais do que compensar a longo prazo; a 
ocorrência de um problema sério e possivelmente fatal 
convencerá qualquer pesquisador. Encorajamos o leitor 
a adotar essas técnicas antes que problemas oriundos da 
análise o forcem a fazê-lo. 


EXAME GRÁFICO DOS DADOS 


Como discutido anteriormente, o uso de técnicas multi- 
variadas representa uma responsabilidade adicional do 
pesquisador para entender, avaliar e interpretar resul- 
tados complexos. Essa complexidade requer uma com- 
preensão direta das características básicas dos dados 
subjacentes e suas relações. Quando análises univaria- 
das são consideradas, o nível de compreensão é bastante 
simples. À medida que o pesquisador se dirige a análises 
multivariadas mais complexas, porém, a necessidade e 
o nível de compreensão aumentam dramaticamente e 
requerem medidas diagnósticas empíricas ainda mais 
poderosas. O pesquisador pode ser inestimavelmente 
auxiliado a conquistar maior entendimento sobre o sig- 
nificado dessas medidas diagnósticas através do emprego 
de técnicas gráficas, retratando as características básicas 
de variáveis individuais e relações entre as mesmas em 
uma “imagem” simples. Por exemplo, um simples dia- 
grama de dispersão não apenas representa em uma só 
imagem os dois elementos básicos de um coeficiente de 
correlação — o tipo de relação (positiva ou negativa) e a 
força da relação (a dispersão dos casos) — mas é também 
um meio visual simples de avaliação de linearidade, que 
requer uma análise muito mais detalhada se considerar- 
mos estritamente meios empíricos. Em correspondência, 
um gráfico de caixas ilustra não apenas o nível geral de 
diferenças ao longo de grupos mostrado em um teste-t 
ou análise de variância, mas também as diferenças entre 
pares de grupos e a existência de observações atípicas 
que exigiriam mais análise empírica para serem detecta- 
das se o método gráfico não fosse usado. O objetivo do 
uso de técnicas gráficas não é a substituição de medidas 
empíricas, mas complementar com uma representação 
visual das relações básicas, de modo que os pesquisa- 
dores possam se sentir confiantes em seu entendimento 
dessas relações. 

O advento e a difusão dos programas estatísticos proje- 
tados para o computador pessoal têm aumentado o acesso 
a tais métodos. A maioria dos programas estatísticos tem 
módulos abrangentes de técnicas gráficas para exame de 
dados que são ampliados com medidas estatísticas mais 
detalhadas da descrição dos dados. As seções que seguem 
detalham algumas das técnicas mais amplamente usadas 
para o exame de características da distribuição, das rela- 
ções bivariadas, das diferenças de grupos e mesmo dos 
perfis multivariados. 
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Perfil univariado: exame do 
formato da distribuição 


O ponto de partida para o entendimento da natureza de 
qualquer variável é caracterizar a forma de sua distribui- 
ção. Várias medidas estatísticas são discutidas em uma 
seção adiante sobre normalidade, mas muitas vezes o pes- 
quisador pode alcançar uma perspectiva adequada sobre a 
variável por meio de um histograma. Um histograma é uma 
representação gráfica de uma única variável que representa 
a frequência de ocorrências (valores dos dados) dentro de 
categorias de dados. As fregiiências são graficamente re- 
presentadas para examinar a forma da distribuição de va- 
lores. Se os valores inteiros variam de 1 a 10, o pesquisador 
pode construir um histograma contando o número de res- 
postas para cada valor inteiro. Para variáveis contínuas, são 
formadas categorias, dentro das quais as fregiiências de va- 
lores dos dados são tabuladas. Se o exame da distribuição 
é para avaliar sua normalidade (ver seção sobre teste de 
suposições para detalhes sobre este ponto), a curva normal 
também pode ser sobreposta sobre a distribuição para ava- 
liar a correspondência da distribuição real com a desejada 
distribuição (normal). O histograma pode ser empregado 
para examinar qualquer tipo de variável métrica. 


Por exemplo, as respostas para X, a partir do banco de 
dados introduzido no Capítulo 1 são representadas na 
Figura 2-1. Categorias com pontos médios de 5,0, 5,25, 
5,50, 5,75, ..., 10,0 são usadas. A altura das barras repre- 
senta as frequências dos valores dos dados dentro de 
cada categoria. A curva normal também é sobreposta 
na distribuição. Como será mostrado posteriormente, 
medidas empíricas indicam que a distribuição de X, des- 
via significativamente da distribuição normal. Mas de 
que forma difere? A medida empírica que mais difere 
é a curtose, representando a elevação ou o achatamen- 
to da distribuição. Os valores indicam que a distribui- 
ção é mais achatada do que o esperado. O que o histo- 
grama revela? O meio da distribuição recai abaixo da 
curva normal sobreposta, enquanto ambos os extremos 
laterais são mais altos do que o esperado. Assim, a dis- 
tribuição não mostra qualquer assimetria considerável 
para um lado ou outro, mas apenas um encurtamento de 
observações no centro da distribuição. Essa comparação 
também fornece orientação sobre o tipo de transforma- 
ção que seria efetiva se aplicada como correção para a 
não-normalidade. Todas essa informações sobre a distri- 
buição são mostradas em um único histograma. 


Um variante do histograma é o diagrama de ramo- 
e-folhas, o qual apresenta a mesma ilustração gráfica do 
histograma, mas também fornece uma enumeração dos 
valores reais dos dados. Como no histograma, os valores 
dos dados são divididos em categorias, e as frequências 
para cada categoria são tabuladas. Mas o elemento único 


vem no estabelecimento do valor raiz de cada categoria e 
em mostrar cada valor dos dados na representação grá- 
fica. Por exemplo, considere que uma categoria é defini- 
da como todos os valores entre 3,0 e 4,0. Na distribuição 
sendo apurada, assuma que quatro valores recaem nesta 
categoria (3,5, 3,7, 3,7 e 3,9). Em um histograma, essa fre- 
quência é mostrada por uma barra com quatro unidades 
de altura. O diagrama de ramo-e-folhas também exibe 
essa frequência, mas no lugar de uma barra há uma série 
de quatro valores. Como os valores são retratados? Com o 
ramo definido como 3,0, as folhas são definidas como 5, 7, 
7e 9. Assim, quando vemos o diagrama de ramo-e-folhas, 
percebemos que a categoria contém quatro valores, mas 
podemos também rapidamente calcular os valores reais 
adicionando o ramo para cada uma das folhas. 


Novamente, examinemos a distribuição de X,, desta vez 
com um diagrama de ramo-e-folhas (Figura 2-2). A pri- 
meira categoria é de 5,0 a 5,5; logo, o ramo é 5,0. As três 
observações com valores nesse intervalo são 5,0, 5,1 e 
5,2. Essa distribuição é mostrada como três folhas de 0, 
1 e 2. Elas são também os três valores mais baixos para 
X,. No próximo ramo, o valor é novamente 5,0. Aqui, 
10 observações variam de 5,5 a 5,9. Esses valores corres- 
pondem às folhas de 5 e* 9. No outro extremo da figura, 
o ramo é 10,0. Ele é associado com duas folhas (0 e 0), 
representando dois valores de 10,0, os mais altos de X,. 
O pesquisador pode obter a mesma visão da forma da 
distribuição como no histograma, mas também examinar 
os valores reais de dados. 


Perfil bivariado: exame da 
relação entre variáveis 


Quando o exame da distribuição de uma variável é essen- 
cial, muitas vezes o pesquisador também está interessado 
em examinar relações entre duas ou mais variáveis. O mé- 
todo mais popular para examinar relações bivariadas é o 
diagrama de dispersão, um gráfico de pontos baseado em 
duas variáveis. Uma variável define o eixo horizontal e a 
outra define o eixo vertical. Variáveis podem ser qualquer 
valor métrico. Os pontos no gráfico representam os valo- 
res conjuntos correspondentes das variáveis para qualquer 
caso dado. O padrão de pontos representa a relação entre 
variáveis. Uma forte organização de pontos ao longo de 
uma linha reta caracteriza uma relação linear ou correla- 
ção. Um conjunto curvilíneo de pontos pode denotar uma 
relação não-linear, a qual pode ser acomodada de muitas 
maneiras (ver discussões posteriores sobre linearidade). 
Ou pode haver apenas um padrão aparentemente aleatório 
de pontos, indicando relação alguma. 


*N. de R. T.: A frase correta seria “Esses valores correspondem às 
folhas de 5 a 9”. 
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Xe (Qualidade do produto) 


FIGURA 2-1 


Entre os muitos tipos de diagramas de dispersão, um 
formato particularmente adequado a técnicas multivaria- 
das é a matriz de dispersão, na qual os diagramas de dis- 
persão são representados para todas as combinações de 
variáveis na parte inferior da matriz. A diagonal contém 
histogramas das variáveis. Matrizes de dispersão e diagra- 
mas individuais de dispersão estão agora disponíveis em 
todos os programas estatísticos populares. Uma variante 
do diagrama de dispersão é discutida na seção seguinte 
sobre detecção de observações atípicas, onde uma elip- 
se representando um intervalo especificado de confiança 
para a distribuição normal bivariada é sobreposta para 
permitir a identificação de observações atípicas. 


A Figura 2.3 apresenta os diagramas de dispersão para 
um conjunto de cinco variáveis da base de dados HBAT 
(XX, Xg, Xp € X,). Por exemplo, a mais alta corre- 
lação pode ser facilmente identificada como ocorrendo 
entre X, e X,,, como apontado pelas observações pro- 
ximamente alinhadas em um padrão linear bem defini- 
do. No lado extremo, a correlação logo acima (X, ver- 
sus X,) mostra uma quase total falta de relação, como 
evidenciado pelo padrão altamente disperso de pontos e 
a correlação de 0,001. Finalmente, uma relação inversa 
ou negativa é vista para várias combinações, mais no- 
tavelmente a correlação entre X, e X,, (-0,401). Além 
disso, nenhuma combinação parece exibir uma relação 
não-linear que não pudesse ser representada em uma 
correlação bivariada. 


A matriz de dispersão fornece um método rápido e 
simples para não apenas avaliar a força e magnitude de 
qualquer relação bivariada, mas também um meio para 
identificar padrões não-lineares que possam estar ocul- 
tos se apenas as correlações bivariadas, que são baseadas 
em uma relação linear, são examinadas. 


Representação gráfica de distribuição univariada. 


Perfil bivariado: exame das diferenças de grupos 


O pesquisador também enfrenta a compreensão da ex- 
tensão e do caráter de diferenças de uma ou mais variá- 
veis métricas ao longo de dois ou mais grupos formados 
a partir das categorias de uma variável não-métrica. Ava- 
liação de diferenças de grupos é feita através de análises 
univariadas como t-testes e análise de variância, e técnicas 
multivariadas de análise discriminante e análise multiva- 
riada de variância. Outro aspecto importante é identificar 
observações atípicas (descritas com mais detalhes em uma 
seção adiante) que podem se tornar aparentes apenas 
quando os valores dos dados são separados em grupos. 

O método usado para essa tarefa é o gráfico de caixas, 
uma representação pictórica da distribuição de dados de 
uma variável métrica para cada grupo (categoria) de uma 
variável não-métrica (ver exemplo na Figura 2-4). Primei- 
ro, Os quartis superior e inferior da distribuição de dados 
formam os limites superior e inferior da caixa, com o com- 


Gráfico de ramo-e-folhas de qualidade do produto 


Frequência Ramo & Folha 
3,00 5 012 
10,00 5 5567777899 
10,00 6 0112344444 
10,00 6 5567777999 
5,00 7 01144 
11,00 7 55666777899 
9,00 8 000122234 
14,00 8 55556667777778 
18,00 9 001111222333333444 
8,00 9 56699999 
2,00 10 00 
Largura do ramo: 1,0 
Cada folha: 1 caso(s) 


FIGURA 2-2 Perfil univariado: gráfico de ramo-e-folhas de X, 
(Qualidade do produto). 
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X o 001 792 229 
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FIGURA 2-3 Perfil bivariado de relações entre variáveis: matriz de 
dispersão de variáveis métricas selecionadas (X,, X,, Xa, X,2 € X,3). 


Nota: Valores acima da diagonal são correlações bivariadas, com diagramas 
de dispersão correspondentes abaixo da diagonal. A diagonal representa a 
distribuição de cada variável. 


primento da caixa sendo a distância entre o 25º percen- 
tile o 75º percentil. A caixa contém os 50% centrais dos 
dados, e quanto maior a caixa, maior a dispersão (p. ex., 
desvio padrão) das observações. A mediana é represen- 
tada por uma linha sólida dentro da caixa. Se a mediana 
se encontra próxima de um extremo da caixa, assimetria 
na direção oposta é indicada. As linhas que se estendem a 
partir de cada caixa (chamadas de whiskers) representam 
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Xg Qualidade do produto 


4 | 
Menos Entre 1 Mais do 
de 1 ano e 5 anos que 5 anos 


XX Tipo de cliente 


a distância da menor e da maior das observações que es- 
tão a menos de um quartil da caixa. Observações atípicas 
(que variam entre 1,0 e 1,5 quartis de distância da caixa) 
e valores extremos (observações a mais de 1,5 quartis do 
extremo da caixa) são representados por símbolos fora 
dos whiskers. Ao usar gráficos de caixas, a meta é retratar 
não somente a informação que é dada em testes estatísti- 
cos (os grupos são diferentes?), mas outras informações 
descritivas que aumentam nossa compreensão sobre as 
diferenças de grupos. 


A Figura 2-4 mostra os gráficos de caixas para X, e X, 
para cada um dos três grupos de X, (Tipo de cliente). 
Antes de examinar os gráficos de caixas para cada variá- 
vel, vejamos primeiramente o que os testes estatísticos 
nos dizem sobre as diferenças ao longo desses grupos 
para cada variável. Para X,, um teste de análise simples 
de variância indica diferença estatística altamente signi- 
ficante (valor F de 36,6 e um nível de significância de 
0,000) ao longo dos três grupos. Para X,, porém, o teste 
de análise de variância não mostra qualquer diferença 
estatisticamente significante (nível de significância de 
0,419) ao longo dos grupos de X.. 

Usando gráficos de caixas, o que podemos aprender 
sobre essas mesmas diferenças de grupos? Como vemos 
no gráfico de caixas de X,, percebemos diferenças subs- 
tanciais ao longo dos grupos que confirmam os resultados 
estatísticos. Podemos também perceber que as diferenças 
primárias estão entre grupos 1 e 2 versus grupo 3. Essen- 
cialmente, os grupos 1 e 2 parecem mais ou menos iguais. 
Se executássemos mais testes estatísticos olhando para 


cada par de grupos separadamente, os testes confirmariam 
(Continua) 
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FIGURA 2-4 Perfil bivariado de diferenças de grupos: gráficos de caixas de X, (Qualidade do produto) e X, (Atividades de 


comércio eletrônico) com X, (Tipo de cliente). 
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que as únicas diferenças estatisticamente significantes são 
grupo 1 versus 3 e grupo 2 versus 3. Também podemos 
perceber que o grupo 2 tem substancialmente mais disper- 
são (uma seção de caixa maior no gráfico de caixas), o que 
evita sua diferença do grupo 1. Os gráficos de caixas assim 
fornecem mais informações sobre a extensão das diferen- 
ças de grupos de X, do que o teste estatístico. 

Para X, podemos ver que os três grupos são essencial- 
mente iguais, como verificado pelo teste estatístico não- 
significante. Podemos também perceber várias observa- 
ções atípicas em cada um dos três grupos (como indicado 
pelas notações na parte superior de cada representação 
gráfica além dos whiskers). Apesar de as observações atí- 
picas não impactarem as diferenças de grupos neste caso, 
o pesquisador é alertado sobre sua presença pelos grá- 
ficos de caixas. O pesquisador deve examinar essas ob- 
servações e considerar as possíveis prevenções discutidas 
mais detalhadamente ao longo deste capítulo. 


Perfis multivariados 


Até aqui, os métodos gráficos têm se restringido a des- 
crições univariadas ou bivariadas. No entanto, em muitos 
casos, o pesquisador pode querer comparar observações 
caracterizadas sobre um perfil multivariado, seja para 
fins descritivos ou como complemento a procedimentos 
analíticos. Para tratar dessa necessidade, foram elabora- 
dos vários métodos gráficos multivariados que giram em 
torno de uma entre três abordagens [10]. A primeira é um 
retrato direto dos valores dos dados, por (a) glifos ou me- 
troglifos, que são uma espécie de círculo cujo raio corres- 
ponde a um valor de um dado, ou (b) perfis multivariados 
que retratam algo como uma barra para cada observação. 
Uma segunda forma de visual multivariado envolve uma 
transformação matemática dos dados originais em uma re- 
lação matemática que pode ser representada graficamen- 
te. A técnica mais comum é a transformação de Fourier 
de Andrew [1]. O tratamento final é o uso de disposições 
gráficas à base de ícones, sendo o mais popular uma face 
[5]. O valor desse tipo de visual é a capacidade inerente de 
processamento que os humanos têm para sua interpreta- 
ção. Como observado por Chernoff [5]: 


Acredito que aprendemos muito cedo a estudar e 
reagir a rostos reais. Nossa biblioteca de respostas a 
rostos esgota uma grande parte de nosso dicionário 
de emoções e idéias. Percebemos os rostos como 
um todo, e nosso computador interno é rápido em 
assimilar a informação relevante e filtrar o ruído 
quando olhamos um número limitado de rostos. 


As representações faciais fornecem um formato grá- 
fico potente, mas também geram algumas considerações 
que influenciam a correspondência das variáveis a expres- 
sões faciais, percepções não-intencionais e a quantidade 


de informação que pode realmente ser acomodada. Uma 
discussão dessas questões está além do escopo deste texto, 
e os leitores interessados são encorajados a estudá-las an- 
tes de qualquer tentativa de usar esses métodos [24, 25]. 


A Figura 2-5 contém ilustrações de três tipos de repre- 
sentação gráfica multivariada produzida por meio de 
SYSTAT, os quais também estão disponíveis em diver- 
sos outros programas estatísticos de computador. A par- 
te superior da Figura 2-5 contém exemplos de cada tipo 
de representação gráfica multivariada: perfis, transfor- 
mações de Fourier, e ícones (faces de Chernoff). Valo- 
res de dados (escores médios) para quatro grupos sobre 
sete variáveis estão contidos em uma tabela na parte de 
baixo da figura. A partir dos valores reais na tabela, simi- 
laridades e diferenças tanto ao longo de variáveis em um 
grupo quanto entre grupos são difíceis de distinguir. O 
objetivo dos perfis multivariados é retratar os dados de 
uma maneira que permita a identificação de diferenças e 
similaridades. 

À primeira representação na Figura 2-5 contém perfis 
multivariados. Começando com a parte mais à esquerda 
dos gráficos, vemos o gráfico para o grupo 2 como o mais 
baixo e o mais alto para os grupos 1 e 4. Esse padrão cor- 
responde aos valores de V, (menor para grupo 2 e maior 
para os grupos 1 e 4). Analogamente, podem ser feitas 
comparações entre variáveis para o grupo 1, onde facil- 
mente percebemos que V, tem o mais alto valor. O se- 
gundo tipo de disposição gráfica multivariada na figura é 
a transformação de Fourier de Andrew, a qual represen- 
ta os valores dos dados por meio de uma expressão ma- 
temática. Apesar de comparações sobre um único valor 
serem mais difíceis, essa forma de disposição gráfica for- 
nece uma representação única que viabiliza comparação 
e agrupamento generalizados de observações. Tem parti- 
cular valor quando o número de observações é grande. 

Finalmente, ícones (faces de Chernoff) foram cons- 
truídos com as sete variáveis associadas a diversas carac- 
terísticas faciais. Neste exemplo, V, controla a retratação 
da boca, V, corresponde à sobrancelha, V, é associada ao 
nariz, V, são os olhos, V, controla o formato do rosto, V, 
refere-se às orelhas, e V, é associada à posição da pupila. 
No que se refere a V,, os grupos 1 e 4 têm sorrisos, e o 
grupo 2, uma carranca. Isso corresponde a grandes valo- 
res para Os grupos 1 e 4 e pequenos valores para o grupo 
dois. Essa forma de disposição gráfica combina a habili- 
dade de fazer comparações específicas entre ou dentro 
de grupos vistos no método de perfil com a facilidade de 
realizar comparações globais mais generalizadas encon- 
tradas nas transformações de Fourier de Andrew. 


O pesquisador pode empregar qualquer um dos méto- 
dos quando examina dados multivariados para fornecer 
um formato que é muitas vezes mais esclarecedor do que 
apenas uma revisão dos valores reais de dados. Além dis- 
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Transformações de Fourier de Andrew 


Grupo 1 Grupo 2 Grupo 3 Grupo 4 
s 3 3 3 
5 5 5 5 
2 2 2 2 
(O) (o) O) (o) 
Ko) Ko) Ko) Ko) 
io) (0p] (é) (00) 
2 2 2 2 
o [am fam [= 
[o] (o) [O] o) 
am [am [am [am 
(o) (o) (e) (e) 
o o o [OR 
E E E E 
(0) 2 1 1 1 (0) a 1 1 j (e) ha) 1 1 1 [0) 2 1 1 1 
O “480-90 o 90 180 O “180-90 o 90 180 O “80-90 0 90 180 O “180-90 O 90 180 
Graus Graus Graus Graus 
Faces de Chernoff 
Grupo 1 Grupo 2 Grupo 3 


Dados reais 
Grupo V, Vo Va Va Vs Ve y 

1 4,794 1,622 8,267 4,717 3,222 2,067 5,044 

2 2,011 2,133 6,544 5,267 2,039 2,672 8,483 

3 3,700 4,158 6,008 6,242 3,900 3,233 8,258 

4 4,809 1,510 9,319 5,690 3,148 3,195 6,981 
FIGURA 2-5 Exemplos de representações gráficas multivariadas. 
so, os métodos multivariados capacitam o pesquisador a 
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usar uma única representação gráfica para descrever um 
grande número de variáveis, no lugar de usar um grande 
número de métodos univariados ou bivariados para retra- 
tar o mesmo número de variáveis. 


Resumo 


As disposições gráficas desta seção não são um substituto 
para as medidas diagnósticas estatísticas discutidas em se- 
ções posteriores deste e de outros capítulos. Elas fornecem 
um meio complementar para desenvolver uma perspectiva 
sobre o caráter dos dados e das inter-relações existentes, 
mesmo que sejam de natureza multivariada. O velho adá- 
gio “uma imagem vale mais que mil palavras” demonstra 
ser verdadeiro muitas vezes no emprego de representações 
gráficas para aplicações comparativas ou diagnósticas. 


Dados perdidos, onde valores válidos sobre uma ou mais 
variáveis não estão disponíveis para análise, são um fato 
da vida em análise multivariada. De fato, raramente o 
pesquisador evita algum tipo de problema com dados per- 
didos. O desafio do pesquisador é abordar as questões ge- 
radas pelos dados perdidos que afetam a generalidade dos 
resultados. Para conseguir isso, a preocupação primária 
do pesquisador é identificar padrões e relações inerentes 
aos dados perdidos a fim de manter tanto quanto possível 
a distribuição original de valores quando qualquer ação 
corretiva é aplicada. A extensão dos dados perdidos é 
uma questão secundária na maioria dos casos, afetando 
o tipo de ação corretiva empregada. Esses padrões e rela- 
ções são um resultado de um processo de dados perdidos, 
que é qualquer evento sistemático externo ao responden- 
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te (como erros de entrada de dados ou problemas de co- 
leta de dados) ou qualquer ação por parte do respondente 
(como recusa a responder) que leva a valores perdidos. A 
necessidade de se concentrar nos motivos dos dados per- 
didos surge do fato de que o pesquisador deve compreen- 
der os processos que conduzem aos dados perdidos a fim 
de selecionar o curso de ação apropriado. 


O impacto de dados perdidos 


Os efeitos de alguns processos de dados perdidos são co- 
nhecidos e diretamente acomodados no plano de pesqui- 
sa, como será discutido adiante nesta seção. Mais freqiuen- 
temente, os processos de dados perdidos, especialmente 
aqueles baseados em ações do respondente (p. ex., não 
responder a uma questão ou conjunto de questões), ra- 
ramente são conhecidos de antemão. Para identificar pa- 
drões nos dados perdidos que caracterizariam o processo 
de dados perdidos, o pesquisador questiona coisas como 
(1) Os dados perdidos estão distribuídos ao acaso pelas 
observações, ou são padrões distintos identificáveis? e (2) 
Qual é a freqiiência dos dados perdidos? Se forem encon- 
trados padrões distintos e a extensão dos dados perdidos 
for suficiente para garantir uma ação, então se considera 
que algum processo de dados perdidos está em operação. 

Por que se preocupar com os processos de dados per- 
didos? Não pode a análise ser executada com os valores 
válidos que temos? Apesar de parecer prudente proceder 
apenas com os valores válidos, tanto considerações subs- 
tantivas quanto práticas necessitam de um exame dos pro- 
cessos de dados perdidos. 


e O impacto prático de dados perdidos é a redução do ta- 
manho de amostra disponível para análise. Por exemplo, 
se ações corretivas para dados perdidos não são aplicadas, 
qualquer observação com dados perdidos sobre qualquer 
uma das variáveis será excluída da análise. Em muitas aná- 
lises multivariadas, particularmente aplicações de pesquisa, 
dados perdidos podem eliminar tantas observações que o 
que era uma amostra adequada é reduzido a uma amostra 
inadequada. Por exemplo, foi mostrado que se 10% dos 
dados são aleatoriamente perdidos em um conjunto de 5 
variáveis, em média quase 60% dos casos terá pelo menos 
um valor perdido [17]. Assim, quando dados completos são 
exigidos, a amostra é reduzida a 40% do tamanho original. 
Em tais situações, o pesquisador deve ou reunir observações 
adicionais, ou encontrar uma ação corretiva para os dados 
perdidos na amostra original. 

e Sob uma perspectiva substantiva, qualquer resultado estatís- 
tico baseado em dados com um processo não-aleatório de 
dados perdidos poderia ser tendencioso. Esse viés acontece 
quando o processo de dados perdidos “provoca” a perda de 
certos dados e esses dados perdidos conduzem a resultados 
errôneos. Por exemplo, o que faríamos se descobríssemos 
que indivíduos que não forneceram suas rendas familiares 
tendiam a ser quase que exclusivamente aqueles com maior 
renda? Você não ficaria desconfiado dos resultados sabendo 
que esse grupo específico de pessoas foi excluído? Os efeitos 
de dados perdidos são chamados às vezes de ocultos devido 


ao fato de que ainda conseguimos resultados das análises 
mesmo sem os dados perdidos. O pesquisador poderia con- 
siderar esses resultados tendenciosos como válidos a menos 
que os processos inerentes de perda de dados sejam identifi- 
cados e compreendidos. 


A preocupação com dados perdidos é semelhante 
à necessidade de compreender as causas de ausência de 
resposta no processo de coleta de dados. Assim como es- 
tamos preocupados sobre quem não respondeu durante a 
coleta de dados e qualquer viés subsegiiente, também de- 
vemos ficar preocupados com a ausência de respostas ou 
dados perdidos entre os dados coletados. Portanto, o pes- 
quisador precisa não apenas remediar os dados perdidos, 
se possível, mas também entender qualquer processo de 
perda de dados e seus impactos. Porém, muito frequen- 
temente, pesquisadores ou ignoram os dados perdidos, 
ou invocam uma ação corretiva sem se preocuparem com 
os efeitos dos dados perdidos. A próxima seção emprega 
um exemplo simples para ilustrar alguns desses efeitos e 
algumas ações corretivas simples, ainda que efetivas. Em 
seguida, um processo de quatro etapas para identificar e 
remediar processos de perda de dados é apresentado. Fi- 
nalmente, o processo de quatro etapas é aplicado a um pe- 
queno conjunto de dados com dados perdidos. 


Um exemplo simples de uma 
análise de dados perdidos 


Para ilustrar os impactos substantivos e práticos da per- 
da de dados, a Tabela 2-1 contém um exemplo simples de 
dados perdidos entre 20 casos. Como é comum em mui- 
tos conjuntos de dados, particularmente em pesquisas de 
levantamento, o número de dados perdidos varia muito, 
tanto entre casos quanto entre variáveis. 


Neste exemplo, percebemos que todas as variáveis (V, 
a V,) têm alguns dados perdidos, sendo que V, tem per- 
didos mais da metade (55%) de todos os valores. Três 
casos (3, 13 e 15) têm mais de 50% de dados perdidos, e 
apenas cinco casos têm dados completos. Ao todo, 23% 
dos valores dos dados estão perdidos. 

De um ponto de vista prático, os dados perdidos neste 
exemplo podem se tornar bastante problemáticos em ter- 
mos de redução do tamanho da amostra. Por exemplo, se 
fosse empregada uma análise multivariada que exigisse 
dados completos sobre todas as cinco variáveis, a amostra 
seria reduzida a apenas os cinco casos sem dados perdi- 
dos (casos 1, 7,8, 12 e 20). Este tamanho de amostra é 
pequeno para qualquer tipo de análise. Entre as soluções 
para dados perdidos que serão discutidas detalhadamente 
em seções adiante, uma opção óbvia é a eliminação de va- 
riáveis e/ou casos. Em nosso exemplo, assumindo que os 
fundamentos conceituais da pesquisa não são substancial- 
mente alterados pela eliminação de uma variável, elimi- 


nar V, é um tratamento para reduzir o número de dados 
(Continua) 
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(Continuação) 

perdidos. Eliminando-se apenas V,, sete casos adicionais, 
em um total de 12, agora têm informações completas. Se 
os três casos (3, 13, 15) com números excepcionalmente 
altos de dados perdidos também forem eliminados, o nú- 
mero total de dados perdidos se reduzirá a apenas cinco 
casos, ou 7,4% de todos os valores. 

O impacto substantivo, contudo, pode ser visto nes- 
tes cinco que ainda são dados perdidos; todos ocorrem 
em V,. Comparando os valores de V, para os cinco casos 
remanescentes com dados perdidos para V, (casos 2, 6, 
14, 16 e 18) versus aqueles casos que têm valores V, vá- 
lidos, um padrão distinto emerge. Os cinco casos com 
valores perdidos para V, têm os cinco menores valores 
para V,, indicando que dados perdidos para V, estão 
fortemente associados a escores menores sobre V,. Essa 
associação sistemática entre dados perdidos e válidos 
provoca um impacto direto em qualquer análise na qual 
V, e V, estejam incluídas. Por exemplo, o escore médio 
para V, será maior se casos com dados perdidos sobre V, 
forem excluídos (média = 8,4) do que se incluírem aque- 
les cinco casos (média = 7,8). Neste caso, o pesquisador 
sempre deve examinar minuciosamente os resultados 
que incluem V, e V, com vistas ao possível impacto desse 
processo de dados perdidos sobre os resultados. 


Como vimos no exemplo, encontrar uma solução para 
dados perdidos (p. ex., eliminar casos ou variáveis) pode 
ser uma solução prática para os mesmos. Entretanto, o 
pesquisador deve se proteger contra a aplicação de tais 
soluções sem o diagnóstico dos processos de perda de da- 
dos. Evitando-se o diagnóstico, pode-se tratar do proble- 
ma prático de tamanho de amostra, mas apenas se cobrem 
as preocupações substantivas. O que se faz necessário é 
um processo estruturado de primeiramente identificar a 
presença de processos de dados perdidos, e então aplicar 
as ações corretivas apropriadas. Na próxima seção, discu- 
timos um processo de quatro etapas para abordar tanto as 
questões práticas quanto substantivas que surgem a partir 
da perda de dados. 


Um processo de quatro etapas para 
identificar dados perdidos e 
aplicar ações corretivas 


Como visto nas discussões anteriores, dados perdidos 
podem ter impactos significantes sobre qualquer análise, 
particularmente aquelas de natureza multivariada. Além 
disso, à medida que as relações sob investigação se tor- 
nam mais complexas, também aumenta a possibilidade 
de não se detectarem dados perdidos e seus efeitos. Esses 
fatores se combinam para que seja essencial que qualquer 


TABELA 2-1 Exemplo hipotético de dados perdidos 
Dados perdidos por caso 
Identificação do caso V, V, V, V, Vs Número Percentual 
1 1,3 9,9 6,7 3,0 2,6 0 0 
2 41 5; 2,9 2 40 
3 9,9 3,0 3 60 
4 0,9 8,6 2,1 1,8 1 20 
5 0,4 8,3 1,2 17 1 20 
6 1,5 6,7 4,8 2,5 1 20 
7 0,2 8,8 4,5 3,0 2,4 0 0 
8 2,1 8,0 3,0 3,8 1,4 0 0 
9 1,8 7,6 3,2 2, 1 20 
10 4,5 8,0 3,3 2,2 1 20 
11 2,5 9,2 3,3 3,9 1 20 
12 4,5 6,4 53 3,0 2,5 0 9 
13 2,7 4 80 
14 2,8 6,1 6,4 3,8 1 20 
15 3,7 3,0 3 60 
16 1,6 6,4 5,0 2,1 1 20 
17 0,5 9,2 3,3 2,8 1 20 
18 2,8 5,2 5,0 2,17 1 20 
19 2,2 6,7 2,6 2,9 1 20 
20 1,8 9,0 5,0 2,2 3,0 0 0 
Dados perdidos por variável Valores perdidos totais 
Número 2 2 11 6 2 Número: 23 
Percentual 10 10 55 30 10 Percentual: 23 


60 Análise Multivariada de Dados 


análise multivariada comece com um exame dos proces- 
sos de perda de dados. Para este fim, um processo de qua- 
tro etapas (ver Figura 2-6) é apresentado, o qual aborda 
os tipos e extensão dos dados perdidos, a identificação de 
processos de perda de dados, e ações corretivas dispo- 
níveis para a acomodação de dados perdidos em análise 
multivariada. 


Passo 1: Determinar o tipo de dados perdidos 

O primeiro passo em qualquer exame de dados perdidos 
é determinar o tipo de dados perdidos envolvidos. Aqui 
o pesquisador está preocupado se os dados perdidos são 
parte do planejamento da pesquisa e estão sob controle do 
pesquisador, ou se as “causas” e impactos são verdadeira- 
mente desconhecidos. Comecemos com os dados perdidos 
que fazem parte do planejamento da pesquisa e que po- 
dem ser manuseados diretamente pelo pesquisador. 


Dados perdidos ignoráveis. Muitas vezes, dados perdi- 
dos são esperados e fazem parte do planejamento da pes- 
quisa. Nesses casos, os dados perdidos são chamados de 
dados perdidos ignoráveis, o que significa que ações corre- 
tivas específicas para perda de dados não são necessárias, 
pois os mesmos são inerentemente permitidos na técnica 
usada [18,22]. A justificativa para a designação de dados 
perdidos como ignoráveis é que o processo de perda de 
dados opera aleatoriamente (i.e., os valores observados 
são uma amostra aleatória do conjunto total de valores, 
observados e perdidos) ou explicitamente se acomoda na 
técnica utilizada. Há três casos nos quais um pesquisador 
mais frequentemente encontra casos perdidos ignoráveis. 


e O primeiro exemplo encontrado em quase todos os levanta- 
mentos e na maioria dos outros conjuntos de dados é o pro- 
cesso de dados perdidos ignoráveis resultante da considera- 
ção de uma amostra da população em vez de dados reunidos 
da população inteira. Nessas situações, os dados perdidos 
são aquelas observações em uma população que não estão 
incluídas quando se considera a amostra. O propósito de téc- 
nicas multivariadas é generalizar a partir de observações de 
amostras para a população inteira, o que é realmente uma 
tentativa de superar os dados perdidos de observações que 
não estão na amostra. O pesquisador torna esses dados per- 
didos ignoráveis usando amostragem probabilística para se- 
lecionar respondentes. A amostragem probabilística permite 
ao pesquisador especificar que o processo de perda de dados 
que leva a observações omitidas é aleatório e que os dados 
perdidos podem ser considerados como erro de amostra nos 
procedimentos estatísticos. Assim, os dados perdidos das ob- 
servações não constantes na amostra são ignoráveis. 

e Um segundo caso de dados perdidos ignoráveis é devido 
ao delineamento específico do processo de coleta de dados. 
Certos planos de amostragem não-probabilística são deli- 
neados para tipos específicos de análise que acomodam a 
natureza não-aleatória da amostra. Muito mais comuns são 
os dados perdidos devido ao delineamento do instrumento 
de coleta de dados, como aqueles referentes aos padrões de 
salto nos quais respondentes passam por cima de seções de 
questões que não são aplicáveis. 


Por exemplo, no exame da resolução de reclamações de 
clientes, pode ser adequado exigir que indivíduos façam 
uma reclamação antes de se fazerem perguntas sobre 
como se lida com reclamações. Para os respondentes que 
não estão reclamando, não há necessidade de responder 
questões sobre o processo, e assim criam-se dados per- 
didos. O pesquisador não está preocupado com esses 
dados perdidos, pois eles são parte do delineamento da 
pesquisa e seria inadequado tentar consertá-los. 


e Um terceiro tipo de dados perdidos ignoráveis acontece 
quando os dados são censurados. Dados censurados são 
observações incompletas devido a seu estágio no processo 
de perda de dados. Um exemplo típico é uma análise das 
causas de morte. Respondentes que ainda vivem não po- 
dem dar informação completa (ou seja, causa ou hora da 
morte) e são, portanto, censurados. Outro exemplo interes- 
sante ocorre na tentativa de se estimar a altura da popula- 
ção geral de um país com base nas alturas dos recrutas das 
forças armadas do mesmo (como citado em [18]). Os dados 
são censurados porque ocasionalmente as forças armadas 
podem impor restrições de altura que variam em nível e 
aplicação. Logo, os pesquisadores se defrontam com a tare- 
fa de estimar a altura da população inteira quando sabe-se 
que certos indivíduos (os que estão abaixo das restrições 
de altura) não estão incluídos na amostra. Em ambos os 
casos, o conhecimento do pesquisador sobre o processo de 
dados perdidos permite o emprego de métodos especializa- 
dos, como a análise de história de eventos, para acomodar 
dados censurados [18]. 


Em cada caso de processo de dados perdidos ignorá- 
veis, o pesquisador tem um meio explícito de acomodar os 
dados perdidos na análise. Deve ser notado que é possível 
ter tanto dados perdidos ignoráveis quanto não-ignoráveis 
no mesmo conjunto de dados quando dois processos dis- 
tintos estão em jogo. 


Processos de dados perdidos que são não-ignoráveis Da- 
dos perdidos que não podem ser classificados como igno- 
ráveis acontecem por muitas razões e em muitas situações. 
Em geral, esses dados perdidos se encaixam em duas clas- 
ses: processos conhecidos versus desconhecidos baseados 
em suas fontes. 


e Muitos processos de dados perdidos são conhecidos pelo 
pesquisador no sentido de que podem ser identificados de- 
vido a fatores de procedimento, como entrada de dados que 
criam códigos inválidos, restrições de desfecho (p. ex., pe- 
quenas contagens em dados de censo de uma nação), falha 
para completar o questionário inteiro, ou mesmo a morte 
do respondente. Nessas situações, o pesquisador tem pouco 
controle sobre os processos de perda de dados, mas algumas 
ações corretivas podem ser aplicáveis se os dados perdidos 
forem percebidos como aleatórios. 

e Processos desconhecidos de perda de dados são menos fa- 
cilmente identificados e acomodados. Mais frequentemente, 
esses casos estão diretamente relacionados com o responden- 
te. Um exemplo é a recusa para responder certas questões, 
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Aplicar técnicas 
Passo 1: Determinar o tipo de especializadas 
dados perdidos. 


São ignoráveis? 


para dados 
perdidos 
ignoráveis 


Passo 2: Determinar a extensão 
dos dados perdidos. 
E substancial o bastante 
para garantir ação? 


Eliminar casos 
e/ou variáveis 
com elevados Sim 
dados perdidos. | 


Analisar casos e variáveis. 

Deveriam casos e/ou Não 

variáveis ser eliminados 

devido a elevados níveis 
de dados perdidos? 


| 
Não 
! 


Passo 3: Diagnosticar a 
aleatoriedade dos processos 
de perda de dados. 

Os processo são MAR 
(não-aleatórios) ou 
MCAR (aleatórios)? 


MCAR = 


y 


Passo 4: Selecionar o 
método de atribuição. 
MAR : =— 
Deseja substituir os dados 
perdidos por valores? 


Selecionar o método de 
aplicação de dados. 
Deseja usar valores conhecidos 
ou calcular valores de 
substituição a partir de 
dados válidos? 


Selecionar o método de 
aplicação de dados. 
Deseja usar apenas casos 
com dados completos ou todos 
os dados válidos possíveis? 


Apenas dados completos Todos os dados possíveis -Valores conhecidos Calcular valores 


Abordagem fia is 
Abordagens Abordagem FR Atribuição cá cê Abordagem 
baseadas em de caso sda ou o de carta pao baseada em 
modelagem completo dispo Ea eis marcada P regressão 


FIGURA 2-6 Um processo de quatro etapas para identificar dados perdidos e aplicar ações corretivas. 
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o que é comum em perguntas de natureza sensível (como 
renda ou questões controversas) ou quando o respondente 
não tem opinião ou conhecimento suficiente para respon- 
der. O pesquisador deveria antecipar tais problemas e tentar 
minimizá-los no planejamento da pesquisa e nos estágios de 
coleta de dados. No entanto, eles ainda podem ocorrer, e o 
pesquisador deve agora lidar com os dados perdidos resul- 


tantes. Entretanto, nem tudo está perdido.Quando os dados 
perdidos ocorrem em um padrão aleatório, ações corretivas 
podem estar disponíveis para diminuir seus efeitos. 


Na maioria dos casos o pesquisador encara um proces- 
so de perda de dados que não pode ser classificado como 
ignorável. Seja a fonte desse processo de dados perdidos 
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não ignoráveis conhecida ou não, o pesquisador ainda 
deve proceder para o próximo passo do processo e avaliar 
a extensão e impacto dos dados perdidos. 


Passo 2: Determinar a extensão de dados perdidos 

Sabendo-se que alguns dos dados perdidos não são igno- 
ráveis, o pesquisador deve examinar os padrões dos da- 
dos perdidos e determinar a extensão dos mesmos para 
variáveis e casos individuais, e mesmo genericamente. O 
aspecto primário neste passo do processo é determinar 
se a extensão ou quantia de dados perdidos é baixa o su- 
ficiente para não afetar os resultados, mesmo que opere 
de maneira não-aleatória. Se for suficientemente baixa, 
então qualquer das abordagens para remediar perda de 
dados pode ser aplicada. Se o nível de perda de dados não 
é baixo o suficiente, então devemos primeiramente de- 
terminar a aleatoriedade do processo de perda de dados 
antes de escolher uma ação corretiva (passo 3). A questão 
não resolvida neste passo é a seguinte: o que significa bai- 
xo o suficiente? Ao se fazer a avaliação sobre a extensão 
da perda de dados, o pesquisador pode descobrir que a 
eliminação de casos e/ou variáveis reduzirá os dados per- 
didos a níveis baixos o suficiente para permitir correções 
sem se preocupar com a criação de vieses nos resultados. 


Avaliação da extensão e padrões de perda de dados. A 
maneira mais direta para avaliar a extensão de dados per- 
didos é por tabulação (1) do percentual de variáveis com 
dados perdidos para cada caso e (2) do número de casos 
com dados perdidos para cada variável. Este simples pro- 
cesso identifica não somente a extensão dos dados per- 
didos, mas qualquer nível excepcionalmente elevado de 
perda de dados que acontece por casos ou observações 
individuais. O pesquisador deveria procurar por padrões 
não-aleatórios nos dados, como concentração de dados 
perdidos em um conjunto específico de questões, falhas 
que impedem completar o questionário e assim por diante. 
Finalmente, o pesquisador deveria determinar o número 
de casos sem perdas de dados em qualquer uma das va- 
riáveis, o que fornecerá o tamanho de amostra disponível 
para análise se ações corretivas não são aplicadas. 

Com esta informação em mãos, a questão importante 
é: são tantos os dados perdidos para garantir diagnóstico 
adicional? A questão é a possibilidade de que ignorar os 
dados perdidos ou usar alguma ação corretiva para subs- 
tituir valores para os mesmos pode criar um viés nos da- 
dos que afetará sensivelmente os resultados. Ainda que a 
maioria das discussões sobre isso requeira julgamento do 
pesquisador, as duas diretrizes nas Regras Práticas 2-1 se 
aplicam. 

Se for determinado que a extensão é razoavelmente 
baixa e nenhum padrão não-aleatório apareça, então o 
pesquisador pode empregar qualquer uma das técnicas de 
atribuição (passo 4) sem criar viés nos resultados de qual- 
quer maneira apreciável. Se o nível de perda de dados é 
muito elevado, então o pesquisador deve considerar abor- 


dagens específicas para diagnosticar a aleatoriedade dos 
processos de perda de dados (passo 3) antes de proceder à 
aplicação de uma ação corretiva. 


Eliminação de casos e/ou variáveis individuais. Antes de 
proceder com os métodos formalizados para diagnóstico 
de aleatoriedade no passo 3, o pesquisador deveria consi- 
derar a simples ação de eliminar caso(s) e/ou variável(eis) 
com excessivo(s) nível(eis) de perda de dados. O pesqui- 
sador pode descobrir que os dados perdidos estão con- 
centrados em um pequeno subconjunto de casos e/ou 
variáveis, com sua exclusão substancialmente reduzindo 
a extensão dos dados perdidos. Além disso, em muitos ca- 
sos nos quais um padrão não-aleatório de perda de dados 
está presente, esta solução pode ser a mais eficiente. No- 
vamente, não existem diretrizes sobre o necessário nível 
para exclusão (além da sugestão geral de que a extensão 
deva ser “grande”), mas qualquer decisão deveria ser ba- 
seada em considerações empíricas e teóricas, como listado 
nas Regras Práticas 2-2. 

Em última instância o pesquisador deve conciliar os 
ganhos da eliminação de variáveis e/ou casos com dados 
perdidos versus a redução no tamanho da amostra e variá- 
veis para representar os conceitos no estudo. Obviamen- 
te, variáveis ou casos com 50% ou mais de dados perdidos 
deveriam ser eliminados, mas, à medida que o nível de da- 
dos perdidos diminui, o pesquisador deve empregar mais 
julgamentos e “tentativas e erros”. Como veremos na 
discussão sobre métodos de atribuição, avaliar múltiplas 
abordagens para lidar com dados perdidos é preferível. 


REGRAS PRÁTICAS 2-1 


Qual quantia de dados perdidos é excessiva? 


e Dados perdidos abaixo de 10% para um caso ou 
observação individual podem geralmente ser ignorados, 
exceto quando os dados perdidos acontecem de 
maneira não-aleatória (p. ex., concentração em um 


conjunto específico de questões, falhas para finalizar o 
questionário etc.) [19,20] 

O número de casos sem dados perdidos deve ser 
suficiente para a técnica de análise selecionada se 
valores de substituição não forem atribuídos para os 
dados perdidos. 


Passo 3: Diagnosticar a aleatoriedade 

dos processos de perda de dados 

Tendo determinado que a extensão de dados perdidos é 
suficientemente substancial para garantir ação, o próximo 
passo é determinar o grau de aleatoriedade presente nos 
dados perdidos, o que então determina as ações corretivas 
apropriadas e disponíveis. Considere para fins de ilustra- 
ção que informação sobre duas variáveis (X e Y) é cole- 
tada. X não tem dados perdidos, mas Y tem alguns. Um 
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REGRAS PRÁTICAS 2-2 


Eliminações baseadas em dados perdidos 


Variáveis com 15% de dados perdidos ou menos são 
candidatas para eliminação [15], mas níveis mais elevados 
(20% a 30% ) muitas vezes podem ser remediados. 
Certifique-se de que a diminuição nos dados perdidos 
é grande o bastante para justificar a eliminação de uma 
variável ou caso individual. 

Casos com dados perdidos para variáveis dependentes 
tipicamente são eliminados para evitar qualquer 
aumento artificial em relações com variáveis 
independentes. 

Quando eliminar uma variável, garanta que 

variáveis alternativas, preferencialmente altamente 
correlacionadas, estão disponíveis para representar a 
intenção da variável original. 

Sempre considere a possibilidade de executar a análise 
com e sem os casos ou variáveis eliminados para 
identificar diferenças evidentes. 


processo não-aleatório de perda de dados está presente 
entre Xe Y quando diferenças significantes nos valores 
de X acontecem entre casos que têm dados válidos para Y 
versus aqueles casos com dados perdidos em Y. Qualquer 
análise deve explicitamente acomodar qualquer processo 
não-aleatório de perda de dados entre X e Y, senão vieses 
serão introduzidos nos resultados. 


Níveis de aleatoriedade do processo de perda de da- 
dos. Dos dois níveis de aleatoriedade quando se avaliam 
dados perdidos, um requer métodos especiais para acomo- 
dar uma componente não-aleatória (perdidos ao acaso, ou 
MAR). Um segundo nível (completamente perdidos ao 
acaso, ou MCAR) é suficientemente aleatório para aco- 
modar qualquer tipo de ação corretiva para dados perdi- 
dos [18]. Apesar de os nomes de ambos os níveis parece- 
rem indicar que eles refletem padrões aleatórios de perda 
de dados, apenas MCAR permite o uso da ação corretiva 
que se desejar. A diferença entre esses dois níveis está na 
capacidade de generalização para a população, como des- 
crito aqui: 


e Dados perdidos são chamados de perdidos ao acaso (MAR) 
se os valores perdidos de Y dependem de X, mas não de Y. 
Em outras palavras, os valores Y observados representam 
uma amostra aleatória dos valores Y reais para cada valor de 
X, mas os dados observados para Y não representam neces- 
sariamente uma amostra verdadeiramente aleatória de to- 
dos os valores de Y. Apesar de o processo de perda de dados 
ser ao acaso na amostra, seus valores não são generalizáveis 
à população. Mais frequentemente, os dados são perdidos 
aleatoriamente dentro de subgrupos, mas diferem em níveis 
entre subgrupos. O pesquisador deve determinar os fatores 
que definem os subgrupos e os vários níveis entre grupos. 


Por exemplo, considere que sabemos o sexo dos res- 
pondentes (a variável X) e que perguntamos sobre ren- 
da familiar (a variável Y). Descobrimos que os dados 
perdidos são aleatórios tanto para homens como para 
mulheres, mas ocorrem com muito maior frequência 
entre homens do que mulheres. Ainda que o processo 
de perda de dados esteja operando de maneira aleatória 
dentro da variável sexo, qualquer correção aplicada aos 
dados perdidos ainda refletirá o processo de perda de 
dados porque sexo afeta a distribuição final de valores 
de renda familiar. 


e Um maior nível de aleatoriedade é chamado de completa- 
mente perdido ao acaso (MCAR). Nesses casos os valores 
observados de Y são uma amostra verdadeiramente ao aca- 
so de todos os valores Y, sem qualquer processo inerente 
que conduza a vieses sobre os dados observados. Em termos 
simples, os casos com dados perdidos são indistinguíveis 
daqueles com dados completos. 


A partir de nosso exemplo anterior, essa situação seria 
mostrada pelo fato de que os dados perdidos para renda 
familiar estavam perdidos ao acaso em iguais propor- 
ções para ambos os sexos. Nesse processo de perda de 
dados, qualquer uma das ações corretivas pode ser apli- 
cada sem fazer concessões para o impacto de qualquer 
outra variável ou processo de perda de dados. 


Testes diagnósticos para níveis de aleatoriedade. Como 
observado anteriormente, o pesquisador deve verificar 
se o processo de perda de dados ocorre de uma maneira 
completamente aleatória. Quando o conjunto de dados 
é pequeno, o pesquisador pode ser capaz de visualizar 
tais padrões ou executar um conjunto de cálculos sim- 
ples (como em nosso exemplo no início do capítulo). No 
entanto, à medida que tamanho de amostra e número de 
variáveis aumentam, o mesmo ocorre com a necessidade 
de testes diagnósticos empíricos. Alguns programas esta- 
tísticos acrescentam técnicas especificamente elaboradas 
para análise de dados perdidos (p. ex., Análise de Valores 
Perdidos no SPSS), as quais geralmente incluem um ou 
ambos os testes diagnósticos. 


e O primeiro diagnóstico avalia o processo de perda de dados 
de uma única variável Y formando dois grupos: observações 
com dados perdidos para Y e aquelas com valores válidos de 
Y. Testes estatísticos são então executados para determinar 
se diferenças significativas existem entre os dois grupos em 
outras variáveis de interesse. Diferenças significativas indi- 
cam a possibilidade de um processo não-aleatório de perda 
de dados. 
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Usemos nosso exemplo anterior de renda familiar e 
sexo. Primeiro, formaríamos dois grupos de respon- 
dentes, aqueles com dados perdidos sobre a questão de 
renda familiar e aqueles que responderam à questão. 
Compararíamos então os percentuais de sexo para cada 
grupo. Se um gênero (p. ex., masculino) fosse encontra- 
do em maior proporção no grupo de dados perdidos, 
suspeitaríamos de um processo de dados perdidos não- 
aleatório. Se a variável que estivéssemos comparando 
fosse métrica (p. ex., uma atitude ou percepção) em vez 
de categórica (sexo), então testes-t seriam realizados 
para determinar a significância estatística da diferença 
na média da variável entre os dois grupos. O pesquisa- 
dor deve examinar diversas variáveis para ver se algum 
padrão consistente aparece. Lembre-se que algumas di- 
ferenças irão ocorrer por acaso, mas um grande número 
ou um padrão sistemático de diferenças pode indicar um 
padrão não-aleatório inerente. 


e Um segundo tratamento é um teste geral de aleatoriedade 
que determina se os dados perdidos podem ser classificados 
como MCAR. Esse teste analisa o padrão de dados perdidos 
em todas as variáveis e o compara com o padrão esperado 
para um processo aleatório de perda de dados. Se diferenças 
significativas não são encontradas, os dados perdidos podem 
ser classificados como MCAR. Porém, se diferenças signifi- 
cativas são percebidas, o pesquisador deve utilizar as abor- 
dagens descritas previamente para identificar os processos 
específicos de perda de dados que são não-aleatórios. 


Como resultado desses testes, o processo de perda de 
dados é classificado como MAR ou MCAR, o que deter- 
mina então os tipos apropriados de potenciais correções. 
Ainda que atingir o nível de MCAR requeira um padrão 
completamente aleatório na perda de dados, ele é o tipo 
preferido, pois permite a mais vasta gama de potenciais 
ações corretivas. 


Passo 4: Selecionar o método de atribuição 

Neste passo do processo o pesquisador deve escolher a 
abordagem para acomodação de dados perdidos na aná- 
lise. Essa decisão é baseada primariamente na avaliação 
se os dados perdidos são MAR ou MCAR, mas em qual- 
quer caso o pesquisador tem várias opções para atribui- 
ção [14,18,21,22]. Atribuição é o processo de estimação 
de valor perdido baseado em valores válidos de outras va- 
riáveis e/ou casos na amostra. O objetivo é empregar rela- 
ções conhecidas que podem ser identificadas nos valores 
válidos da amostra para auxiliar na estimação dos valores 
perdidos. No entanto, o pesquisador deve considerar cui- 
dadosamente o uso de atribuição em cada caso por causa 
de seu potencial impacto sobre a análise [8]: 


A idéia de atribuição é sedutora e perigosa. É se- 
dutora porque pode acalmar o usuário e levá-lo ao 
estado agradável de acreditar que os dados estão 
completos no final das contas, e é perigosa porque 


mistura situações em que o problema é suficiente- 
mente pequeno de modo que possa ser legitima- 
mente tratado dessa maneira e situações nas quais 
estimadores-padrão aplicados aos dados reais e 
atribuídos têm vieses substanciais. 


Todos os métodos de atribuição discutidos nesta se- 
ção são usados prioritariamente com variáveis métricas; 
variáveis não-métricas são consideradas como perdidas 
a menos que uma técnica de modelagem específica seja 
empregada. Variáveis não-métricas não são tratáveis com 
atribuição, pois ainda que estimativas dos dados perdi- 
dos para variáveis métricas possam ser feitas com valores 
como uma média de todos os valores válidos, nenhuma 
medida comparável está disponível para variáveis não- 
métricas. Desse modo, variáveis não-métricas demandam 
uma estimativa de um valor específico em vez de uma 
estimativa sobre uma escala contínua. Estimar um valor 
perdido para uma variável métrica, como uma atitude ou 
percepção — ou mesmo renda — é diferente de estimar o 
sexo do respondente quando este é um dado perdido. 


Atribuição de um processo de perda de dados MAR. Se 
um processo não-aleatório de perda de dados ou MAR é 
descoberto, o pesquisador deve aplicar apenas uma ação 
corretiva — o tratamento de modelagem especificamente 
elaborado [18]. O uso de qualquer outro método intro- 
duz viés nos resultados. Este conjunto de procedimentos 
explicitamente incorpora os dados perdidos na análise, 
ou através de um processo especificamente planejado 
para estimação de dados perdidos, ou como uma parte 
integral da análise multivariada padrão. O primeiro tra- 
tamento envolve técnicas de estimação de máxima veros- 
similhança que tentam modelar os processos inerentes 
aos dados perdidos e fazer as mais precisas e razoáveis 
estimativas possíveis [12, 18]. Um exemplo é a aborda- 
gem EM[11]. É um método iterativo de dois passos (os 
passos E e M) no qual o estágio E faz as melhores es- 
timativas possíveis dos dados perdidos, e em seguida o 
estágio M promove estimativas dos parâmetros (médias, 
desvios padrão ou correlações) assumindo que os dados 
perdidos foram substituídos. O processo continua através 
dos dois estágios até que a mudança nos valores estima- 
dos seja insignificante e eles substituam os dados perdi- 
dos. Essa técnica tem funcionado efetivamente em casos 
de processos não-aleatórios de perda de dados, mas tem 
demonstrado limitada aplicação devido à necessidade de 
software especializado. Sua inclusão em versões recentes 
dos programas populares de computador (p. ex., o módu- 
lo de Análise de Valor Perdido do SPSS) pode aumentar 
seu uso. Procedimentos comparáveis empregam modela- 
gem de equações estruturais (Capítulo 10) para estimar 
os dados perdidos [2, 4, 9], mas uma discussão detalhada 
desses métodos está além do escopo deste capítulo. 

A segunda abordagem envolve a inclusão de dados 
perdidos diretamente na análise, definindo observações 
com dados perdidos como um subconjunto selecionado 
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da amostra. Essa técnica é mais aplicável para lidar com 
valores perdidos nas variáveis independentes de uma re- 
lação de dependência. Sua premissa foi melhor caracteri- 
zada por Cohen et al. [6]: 


Desse modo, percebemos dados perdidos como 
um fato pragmático que deve ser investigado, e 
não um desastre a ser minimizado. De fato, implí- 
cita a esta filosofia está a idéia de que, como todos 
os outros aspectos da amostra, os dados perdidos 
são uma propriedade da população que buscamos 
generalizar. 


Quando os valores perdidos surgem em uma variável 
não-métrica, o pesquisador pode facilmente definir aque- 
las observações como um grupo separado e então incluí- 
las em qualquer análise. Quando os dados perdidos estão 
presentes em uma variável métrica independente de uma 
relação de dependência, as observações são incorporadas 
diretamente na análise, enquanto as relações entre os va- 
lores válidos são mantidas [6]. Esse procedimento é me- 
lhor ilustrado no contexto da análise de regressão, apesar 
de poder ser usado também em outras relações de depen- 
dência. O primeiro passo é codificar todas as observações 
com dados perdidos com uma variável dicotômica (onde 
os casos com dados perdidos recebem o valor um para va- 
riável dicotômica, e os demais têm o valor zero, como dis- 
cutido na última seção deste capítulo). Em seguida, os va- 
lores perdidos são atribuídos pelo método de substituição 
pela média (ver a próxima seção para uma discussão dessa 
técnica). Finalmente, a relação é estimada por meios nor- 
mais. A variável dicotômica representa a diferença para 
variável dependente entre aquelas observações com dados 
perdidos e as demais com dados válidos. O coeficiente da 
variável dicotômica avalia a significância estatística dessa 
diferença. O coeficiente da variável original representa a 
relação para todos os casos com dados não-perdidos. Este 
método permite ao pesquisador reter todas as observa- 
ções na análise para manter o tamanho da amostra. Ele 
também fornece um teste direto para as diferenças entre 
os dois grupos, juntamente com a relação estimada entre 
as variáveis dependentes e independentes. 

A principal desvantagem de qualquer uma dessas duas 
técnicas é a complexidade envolvida em sua implementa- 
ção ou interpretação por parte do pesquisador. A maioria 
dos pesquisadores não está familiarizada com tais opções, 
e menos ainda com a necessidade de diagnóstico de pro- 
cessos de perda de dados. No entanto, muitas das ações 
corretivas discutidas na próxima seção para dados perdi- 
dos MCAR estão diretamente disponíveis em programas 
estatísticos, tornando sua aplicação mais ampla, mesmo 
quando inadequada. A esperança é que com a crescen- 
te disponibilidade dos programas especializados neces- 
sários, bem como a ciência das implicações de processos 
não-aleatórios de perda de dados, permitir-se-á que esses 
métodos mais adequados sejam utilizados onde se fizer 
necessário para acomodar dados perdidos MAR. 


Atribuição de um processo de perda de dados MCAR. Se 
o pesquisador determina que o processo de perda de da- 
dos pode ser classificado como MCAR, qualquer uma 
entre as duas técnicas básicas será usada: empregando 
apenas dados válidos ou definindo valores de substituição 
para os dados perdidos. Discutiremos primeiramente os 
dois métodos que empregam apenas dados válidos, e em 
seguida promovemos uma discussão sobre os métodos ba- 
seados no uso de valores de substituição para os dados 
perdidos. 


Atribuição usando apenas dados válidos. Alguns 
pesquisadores podem questionar se o emprego de somen- 
te dados válidos é realmente uma forma de atribuição, 
pois nenhum valor de dado é realmente substituído. O 
objetivo dessa abordagem é representar a amostra intei- 
ra com aquelas observações ou casos com dados válidos. 
Como veremos nas duas abordagens a seguir, essa repre- 
sentação pode ser feita de diversas maneiras. A suposição 
subjacente em ambas é que os dados perdidos obedecem 
a um padrão aleatório e que os dados válidos formam uma 
representação adequada. 


e Abordagem de caso completo: O tratamento mais simples e 
direto para lidar com dados perdidos é incluir apenas aque- 
las observações com dados completos, também conhecido 
como abordagem de caso completo. Esse método, também 
conhecido como a técnica LISTWISE em SPSS, está dispo- 
nível em todos os programas estatísticos e é o método pa- 
drão em muitos programas. Não obstante, a abordagem de 
caso completo tem duas desvantagens. Primeiro, ela é muito 
afetada por qualquer processo não-aleatório de perda de 
dados, pois os casos com dados perdidos são eliminados 
da amostra. Assim, ainda que somente observações válidas 
sejam usadas, os resultados não podem ser generalizados 
para a população. Segundo, esse método também resulta na 
maior redução do tamanho da amostra, pois dados perdidos 
em qualquer variável eliminam um caso inteiro. É sabido 
que, com apenas 2% de dados perdidos aleatoriamente, 
mais de 18% dos casos terá algum dado perdido. Assim, em 
muitas situações, mesmo envolvendo quantias muito peque- 
nas de dados perdidos, o tamanho resultante da amostra é 
reduzido a algo inadequado quando tal abordagem é utiliza- 
da. Como resultado, a abordagem de caso completo é mais 
adequada para casos nos quais a extensão de perda de dados 
é pequena, a amostra é suficientemente grande para permi- 
tir a eliminação dos casos com perda de dados, e as relações 
nos dados são tão fortes a ponto de não serem afetadas por 
qualquer processo de perda de dados. 

e Uso de dados totalmente disponíveis: O segundo método 
de atribuição que usa somente dados válidos também não 
chega propriamente a substituir os dados perdidos: ele 
atribui as características de distribuição (p. ex., médias ou 
desvios padrão) ou de relação (p. ex., correlações) a partir 
de cada valor válido. Conhecido como o método de dispo- 
nibilidade total, este método (p. ex., a opção PAIRWISE 
em SPSS) é principalmente usado para estimar correlações 
e maximizar a informação aos pares disponível na amos- 
tra. A característica peculiar dessa técnica é que o perfil de 
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uma variável (p. ex., média, desvio padrão) ou a correlação 
para um par de variáveis se baseia em um conjunto de ob- 
servações potencialmente único. Espera-se que o número 
de observações usadas nos cálculos varie para cada correla- 
ção. O processo de atribuição ocorre não pela substituição 
de dados perdidos, mas pelo uso das correlações obtidas 
somente nos casos com dados válidos como representati- 
vos da amostra inteira. 

Ainda que o método de disponibilidade total maximize 
os dados utilizados e supere o problema de dados perdidos 
em uma única variável, eliminando um caso da análise como 
um todo, vários problemas podem surgir. Primeiro, pode-se 
calcular correlações que estejam “fora do intervalo” e sejam 
inconsistentes com as outras correlações na matriz de cor- 
relação [17]. Qualquer correlação entre X e Y é vinculada à 
sua correlação com uma terceira variável Z, como mostrado 
na seguinte fórmula: 


Intervaloder  =75, +) Ea X1-72 ) 

XV o  XZ YZ XZ YZ 

A correlação entre X e Y pode variar apenas entre —1 e +1 se 
Xe Y tiverem correlação zero com todas as outras variáveis 
na matriz de correlação. Porém, raramente as correlações 
com outras variáveis são zero. À medida que as correlações 
com outras variáveis aumentam, o intervalo da correlação 
entre X e Y diminui, o que aumenta o potencial de a corre- 
lação em um único conjunto de casos ser inconsistente com 
correlações obtidas de outros conjuntos de casos. Por exem- 
plo, se Xe Y têm correlações de 0,6 e 0,4, respectivamente, 
com Z, então o possível intervalo de correlação entre Xe Y 
é 0,24 + 0,73, ou seja, de —0,49 a 0,97. Qualquer valor fora 
desse intervalo é matematicamente inconsistente, ainda que 
possa ocorrer se a correlação for obtida com um número e 
um conjunto de casos diferentes para as duas correlações na 
abordagem de disponibilidade total. 

Um problema associado é que os autovalores na matriz 
de correlação podem se tornar negativos, alterando assim as 
propriedades de variância da matriz de correlação. Apesar 
de a matriz de correlação poder ser ajustada para eliminar 
esse problema (p. ex., a opção ALLVALUE em BMDP), 
muitos procedimentos não incluem esse processo de ajuste. 
Em casos extremos, a matriz de variância/covariância es- 
timada não é positiva definida [17]. Esses dois problemas 
devem ser considerados quando se escolhe a abordagem de 
disponibilidade total. 


Atribuição usando valores de substituição A se- 
gunda forma de atribuição envolve a substituição de va- 
lores perdidos por valores estimados com base em outras 
informações disponíveis na amostra. A principal vanta- 
gem é que, uma vez que os valores de substituição são in- 
corporados, todas as observações estão disponíveis para 
uso na análise. Há muitas opções, que variam da substi- 
tuição direta de valores a processos de estimação basea- 
dos em relações entre as variáveis. A discussão que se 
segue se concentra nos quatro métodos mais amplamente 
usados, apesar de existirem muitas outras formas de atri- 
buição [18,21,22]. Esses métodos podem ser classificados 
quanto a usarem valores conhecidos para a substituição 


ou calcularem o valor de substituição a partir de outras 
observações. 


e Uso de valores conhecidos de substituição: A caracterís- 


tica comum em tais métodos é identificar um valor conhe- 
cido, geralmente de uma única observação, que é usado 
para substituir os dados perdidos. A observação pode ser 
da amostra ou mesmo externa à mesma. Uma consideração 
fundamental é identificar a observação adequada através de 
alguma medida de similaridade. A observação com dados 
perdidos é “casada” com um caso semelhante, o que for- 
nece os valores de substituição para os dados perdidos. As 
opções na avaliação de similaridade estão entre o uso de 
mais variáveis para obter um melhor “casamento” versus a 
complexidade no cálculo de similaridade. 


e Atribuição por carta marcada. Neste método, o pes- 
quisador substitui um valor a partir de outra fonte para 
os valores perdidos. No método por “carta marcada”, o 
valor vem de outra observação na amostra que é conside- 
rada semelhante. Cada observação com dados perdidos 
é ladeada com outro caso que é semelhante em uma va- 
riável (ou variáveis) especificada pelo pesquisador. Em 
seguida, dados perdidos são substituídos por valores váli- 
dos a partir de observação similar. A atribuição por “car- 
ta marcada” obtém o valor de substituição de uma fonte 
externa (p. ex., estudos anteriores, outras amostras etc.). 
Aqui o pesquisador deve estar certo de que o valor de 
substituição de uma fonte externa é mais válido do que 
um valor gerado internamente. Ambas as variantes deste 
método fornecem ao pesquisador a opção de substituir 
os dados perdidos por valores reais de observações seme- 
lhantes que podem ser consideradas mais válidas do que 
algum valor calculado a partir de todos os casos, como a 
média da amostra. 

e Substituição por um caso. Neste método, observações 
inteiras com dados perdidos são substituídas por uma 
outra observação escolhida fora da amostra. Um exem- 
plo comum é substituir uma família da amostra, que não 
pode ser contactada ou que tem extensos dados perdidos, 
por outra família que não esteja na amostra, de prefe- 
rência que seja muito semelhante à observação original. 
Esse método é mais comumente usado para substituir 
observações com dados completamente perdidos, apesar 
de também poder ser empregado para substituir observa- 
ções com menores quantias de dados perdidos. Um pon- 
to importante é a habilidade de obter essas observações 
adicionais não incluídas na amostra original. 


e Cálculo de valores de substituição: A segunda aborda- 


gem básica envolve o cálculo do valor de substituição a 
partir de um conjunto de observações com dados válidos 
na amostra. A premissa é que um valor obtido de todas 
as outras observações na amostra é o mais representativo 
valor de substituição. Esses métodos, particularmente a 
substituição pela média, são mais amplamente emprega- 
dos devido à sua facilidade na implementação em com- 
paração com o uso de valores conhecidos, como discutido 
anteriormente. 


e Substituição pela média. Um dos métodos mais am- 
plamente utilizados, a substituição pela média, troca os 
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valores perdidos para uma variável pelo valor médio da- 
quela variável, com base em todas as respostas válidas. 
O raciocínio desse tratamento é que a média é o melhor 
valor único para substituição. Essa abordagem, apesar de 
muito usada, tem diversas desvantagens. Primeiro, subes- 
tima o valor de variância, pelo emprego do valor médio 
para todos os dados perdidos. Segundo, a real distribui- 
ção de valores fica distorcida, substituindo-se os valores 
perdidos pela média. Terceiro, esse método comprime a 
correlação observada, pois todos os dados perdidos têm 
um único valor constante. Não obstante, tem a vantagem 
de ser fácil de implementar e fornecer todos os casos com 
informação completa. Uma variante desta técnica é a 
substituição pela média do grupo, quando observações 
com dados perdidos são agrupadas em uma segunda va- 
riável e então valores médios para cada grupo são atri- 
buídos para os valores perdidos dentro do grupo. 

e Atribuição por regressão. Neste método, a análise de 
regressão (descrita no Capítulo 4) é usada para prever os 
valores perdidos de uma variável com base em sua rela- 
ção com outras variáveis no conjunto de dados. Primeira- 
mente, uma equação preditiva é formada para cada variá- 
vel com dados perdidos e estimados a partir de todos os 
casos com dados válidos. Em seguida, os valores de subs- 
tituição para dado perdido são calculados a partir dos va- 
lores da observação sobre variáveis na equação preditiva. 
Assim, o valor de substituição é obtido com base naque- 
les valores da observação sobre outras variáveis que se 
evidenciam relacionadas com o valor perdido. 

Apesar do apelo de usar relações já existentes na 
amostra como a base de previsão, esse método também 
tem várias desvantagens. Primeiro, reforça as relações já 
presentes nos dados. À medida que o emprego desse mé- 
todo aumenta, os dados resultantes se tornam mais carac- 
terísticos da amostra e menos generalizáveis. Segundo, a 
menos que termos estocásticos sejam acrescentados aos 
valores estimados, a variância da distribuição é subesti- 
mada. Terceiro, esse método pressupõe que a variável 
com dados perdidos tem correlações substanciais com as 
outras variáveis. Se essas correlações não são suficientes 
para produzir uma estimativa significativa, então outros 
métodos, como a substituição pela média, são preferíveis. 
Quarto, a amostra deve ser grande o bastante para viabi- 
lizar um número suficiente de observações a serem usa- 
das na realização de cada previsão. Finalmente, o proce- 
dimento de regressão não é vinculado às estimativas que 
faz. Logo, os valores previstos podem não estar incluídos 
nos intervalos válidos para variáveis (p. ex., um valor de 
11 pode ser previsto em uma escala de 10 pontos), exigin- 
do assim alguma forma de ajuste adicional. 

Mesmo com todos esses problemas potenciais, o 
método de regressão para atribuições se mantém promis- 
sor naqueles casos em que níveis moderados de dados 
perdidos, amplamente dispersos, estão presentes, e nos 
quais as relações entre variáveis são suficientemente es- 
tabelecidas, de modo que o pesquisador está confiante 
que o uso desse método não influenciará a generalidade 
dos resultados. 


Os possíveis métodos de atribuição variam dos con- 
servadores (método de dados completos) àqueles que 


tentam replicar os dados perdidos tanto quanto possível 
(p. ex. métodos de atribuição por regressão ou baseados 
em modelos). O que deveria ser reconhecido é que cada 
método tem vantagens e desvantagens, de modo que o 
pesquisador deve examinar cada situação de perda de 
dados e escolher o método de atribuição mais adequa- 
do. A Tabela 2-2 fornece uma breve comparação entre 
os métodos de atribuição, mas um rápido exame mostra 
que nenhum método particular é o melhor em todas as 
situações. Contudo, algumas sugestões gerais (ver Regras 
Práticas 2-3) podem ser dadas baseadas na extensão dos 
dados perdidos. 

Dados os muitos métodos disponíveis de atribuição, 
o pesquisador deve também considerar fortemente uma 
estratégia de atribuição múltipla, na qual uma combina- 
ção de vários métodos é empregada. Nesse tratamento, 
dois ou mais métodos de atribuição são usados para de- 
rivar uma estimativa composta — geralmente a média das 
várias estimativas — para o valor perdido. O raciocínio 
dessa abordagem é que o uso de múltiplos tratamentos 
minimiza as preocupações específicas com qualquer mé- 
todo particular e que a composição será a melhor esti- 
mativa possível. A escolha desse tratamento é baseada 
principalmente no balanço entre a percepção do pesqui- 
sador dos benefícios potenciais versus o esforço subs- 
tancialmente maior exigido para aplicar e combinar as 
múltiplas estimativas. 


Resumo 

Sabendo-se que a perda de dados é um fato da vida na 
maioria das pesquisas, pesquisadores devem estar cientes 
das conseqiiências e ações corretivas disponíveis. Como se 
mostrou na discussão anterior, está disponível um proces- 
so estruturado para auxiliar o pesquisador na compreen- 
são dos padrões inerentes da perda de dados e na aplica- 
ção de alguma entre as diversas ações corretivas possíveis. 
Não obstante, o que não pode ser explicitamente definido 
é uma única série de ações que são mais apropriadas em 
todas as situações. Logo, o pesquisador deve fazer uma 
série de escolhas embasadas a fim de evitar muitos dos 
problemas ocultos associados com dados perdidos. 


Uma ilustração de diagnóstico de dados 
perdidos com o processo de quatro etapas 


Para ilustrar o processo de diagnóstico de padrões de da- 
dos perdidos e a aplicação de possíveis ações corretivas, 
um novo conjunto de dados é introduzido. Esse conjunto 
de dados foi coletado durante o pré-teste de um questio- 
nário usado para coletar os dados descritos no Capítulo 
1. O pré-teste envolveu 70 indivíduos e coletou respostas 
sobre 14 variáveis (9 métricas, V, a Vo, e 5 não-métricas, 
Via Vi). As variáveis neste pré-teste não coincidem di- 
retamente com aquelas no conjunto de dados HBAT, e 
por isso elas serão chamadas apenas pelas suas designa- 
ções (p. ex., V;). 
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TABELA 2-2 Comparação entre técnicas de atribuição para dados perdidos 


Método de atribuição 


Vantagens 


Desvantagens 


Melhor a ser usado quando ocorrem: 


Atribuição usando apenas dados válidos 


Dados completos 


O mais simples para 
implementação 

Padrão em muitos programas 
estatísticos 


Mais afetado por processos 
não-aleatórios 

Maior redução no tamanho da 
amostra 

Menor poder estatístico 


e Grandes amostras 
Fortes relações entre variáveis 
Baixos níveis de perda de dados 


Dados totalmente disponíveis 


Maximiza o uso de dados 
válidos 

Resulta no maior tamanho 
possível de amostra sem 
substituir valores 


Variam os tamanhos de 
amostras para cada atribuição 
Pode gerar valores para cor- 
relação e autovalores fora do 
escopo 


Níveis relativamente baixos de dados 
perdidos 

Relações moderadas entre 

variáveis 


Atribuição usando valores de substituição conhecidos 


Substituição por um caso 


Oferece valores realistas de 
substituição (i.e., outra 
observação real) no lugar de 
valores calculados. 


Deve ter casos adicionais fora 
da amostra original 

Deve definir medida de 
similaridade para identificar o 
caso de substituição 


e Casos adicionais disponíveis 
Oportunidades para identificar casos 
de substituição 


Atribuição por carta marcada 


Substitui dados perdidos por 
valores reais a partir do caso 
mais parecido ou do melhor 
valor conhecido 


Deve definir casos 
adequadamente semelhantes 
ou valores externos 
apropriados 


Valores de substituição 
conhecidos, ou 

Indicações de variáveis no 
processo de perda de dados 
sobre as quais se possa basear 
a similaridade 


Atribuição por cálculo de valores de substituição 


Substituição pela média 


Facilmente implementado 
Fornece todos os casos com 
informação completa 


Reduz variância da 
distribuição 

Distorce distribuição dos 
dados 

Comprime correlações 
observadas 


Níveis relativamente baixos de perda 
de dados 

Relações relativamente fortes entre 
variáveis 


Atribuição por regressão 


Emprega relações reais entre as 


variáveis 
Valores de substituição 


calculados com base em valores 


de uma observação em outras 
variáveis 

Conjunto único de preditores 
pode ser usado para cada 
variável com dados perdidos 


Reforça relações existentes e 
reduz generalidade 

Deve ter suficientes relações 
entre variáveis para gerar 
valores previstos válidos 
Subestima variância a menos 
que termo de erro seja 
adicionado ao valor de 
substituição 

Valores de substituição podem 
estar “fora de escopo” 


Níveis moderados ou altos de dados 
perdidos 

Relações suficientemente 
estabelecidas para não 

impactarem generalidade 
Disponibilidade de software 


Métodos baseados em modelos para processos de perda de dados MAR 


Métodos baseados em mo- 
delos 


Acomodam tanto processos de 
dados perdidos aleatórios 
quanto não-aleatórios 

Melhor representação da 
distribuição original de valores 
com menor viés 


Complexa especificação de 
modelo pelo pesquisador 
Requer programa 
especializado 

Tipicamente indisponível de 
forma direta em programas 
(exceto o método EM 

em SPSS) 


e É o único método que pode acomo- 
dar processos não- 

aleatórios de perda de dados 
Elevados níveis de perda de dados 
que demandam método menos ten- 
dencioso para garantir generalidade 
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No entanto, durante o pré-teste, ocorreram dados per- 
didos. As seções a seguir detalham o diagnóstico dos da- 
dos perdidos através do processo de quatro etapas. Diver- 
sos programas de computador incluem análises de dados 
perdidos, entre eles o BMDP e o SPSS. As análises des- 
critas nas seções que se seguem foram executadas com o 
módulo de Análise de Valor Perdido em SPSS, mas todas 
as análises podem ser repetidas por manipulação de da- 
dos e análise convencional. Exemplos são dados em www. 
prenhall.com/hair. 


Passo 1: Determinação do tipo de dados perdidos 
Todos os dados perdidos neste exemplo são não ignorá- 
veis e desconhecidos. Os dados perdidos aconteceram 
devido a motivos não explicados no planejamento da pes- 
quisa — respondentes que simplesmente não responderam. 
Como tal, o pesquisador é obrigado a proceder ao exame 
dos processos de perda de dados. 


REGRAS PRÁTICAS 2-3 


Atribuição de dados perdidos 


e Menos que 10% Qualquer um dos métodos de 
atribuição pode ser aplicado quando dados perdidos 
são tão poucos, apesar de o método de caso completo 
ser considerado o menos preferido. 


Entre 10% e 20% Essa maior presença de dados 
perdidos torna os métodos de disponibilidade total, 
carta marcada e regressão, os preferenciais para dados 


MCAR, enquanto métodos baseados em modelos são 
necessários com processos de perda de dados MAR. 


Acima de 20% Se se considerar necessário atribuir 

dados perdidos quando o nível estiver acima de 20%, os 

métodos preferenciais são: 

e O método de regressão para situações MCAR 

e Métodos baseados em modelos quando dados 
perdidos MAR ocorrem 


Passo 2: Determinação a extensão de dados perdidos 
O objetivo neste passo é determinar se a extensão dos da- 
dos perdidos é suficientemente elevada para garantir um 
diagnóstico de aleatoriedade da perda de dados (passo 3), 
ou se ela está em um nível suficientemente baixo para que 
se proceda diretamente à ação corretiva (passo 4). O pes- 
quisador está interessado no nível de perda de dados com 
base em um caso e variável, mais a extensão geral de perda 
de dados ao longo de todos os casos. 


A Tabela 2-3 contém a estatística descritiva para as obser- 
vações com valores válidos, incluindo a porcentagem de 
casos com dados perdidos em cada variável. Examinando 
as variáveis métricas (V, a V5), percebemos que a menor 


quantia de dados perdidos é de seis casos para V, (9% da 
amostra), subindo para até 30% (21 casos) para V,. Essa 
freqiiência torna V, e V, possíveis candidatos para elimi- 
nação em uma tentativa de reduzir a quantia geral de da- 
dos perdidos. Todas as variáveis não-métricas (V, a V,4) 
têm baixos níveis de dados perdidos e são aceitáveis. 

Além disso, a quantia de dados perdidos por caso 
também é tabulada. Apesar de 26 casos não terem dados 
perdidos, é também aparente que 6 casos têm 50% dos 
dados perdidos, o que os torna prováveis de eliminação 
devido a um número excessivo de valores perdidos. A 
Tabela 2-4 mostra os padrões de perda de dados para 
todos os casos nos quais isso acontece, e esses seis casos 
são listados na parte inferior da tabela. Conforme ve- 
mos os padrões de dados perdidos, percebemos que os 
mesmos ocorrem ao longo de variáveis tanto métricas 
quanto não-métricas, de modo que deveriam ajudar na 
diminuição da amplitude de dados perdidos se elimina- 
dos. Outro benefício é que todos os dados perdidos para 
as variáveis não-métricas acontecem nesses seis casos, 
de modo que após sua eliminação haverá somente dados 
válidos para essas variáveis. 

Ainda que seja óbvio que a eliminação dos seis casos 
irá melhorar a amplitude de dados perdidos, o pesqui- 
sador deve também considerar a possibilidade de elimi- 
nar uma variável (ou mais de uma) se o nível de dados 
perdidos for elevado. As duas variáveis mais indicadas 
para uma eliminação são V, e V,, com 30% e 24% de 
dados perdidos, respectivamente. A Tabela 2-5 forne- 
ce uma visão sobre o impacto da eliminação de uma 
ou ambas, examinando os padrões de dados perdidos 
e avaliando a extensão em que a perda de dados dimi- 
nuirá. Por exemplo, o primeiro padrão (primeira linha) 
mostra que não há dados perdidos para os 26 casos. O 
padrão da segunda linha mostra dados perdidos somen- 
te para V, e indica que apenas 1 caso tem este padrão. 
A coluna no extremo direito indica o número de casos 
com informação completa se esse padrão for eliminado 
(i.e., essas variáveis são eliminadas ou valores de subs- 
tituição são atribuídos). No caso deste primeiro padrão, 
vemos que o número de casos com dados completos au- 
mentaria em uma unidade, para 27, atuando sobre V,, 
pois somente um caso era dado perdido sobre apenas 
V,. Se olharmos para a quarta linha, percebemos que 
6 casos são dados perdidos sobre apenas V,, de forma 
que se eliminarmos V,, 32 casos terão dados completos. 
Finalmente, a terceira linha denota o padrão de perda 
de dados em ambas V, e V,, e se eliminarmos as duas 
variáveis, o número de casos com dados completos au- 
mentará para 37. Logo, eliminar apenas V, acrescenta 1 
caso com dados completos, eliminar apenas V, aumenta 
o total com mais 6 casos, e eliminar ambas as variáveis 
acrescenta mais 11 casos com dados completos, perfa- 
zendo um total de 37. 
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Para fins de ilustração, eliminaremos somente V,, 
deixando V, com uma quantia razoavelmente alta de da- 
dos perdidos para demonstrar seu impacto no processo 
de atribuição. O resultado é uma amostra de 64 casos 
que agora conta com apenas oito variáveis métricas. A 
Tabela 2-6 contém estatísticas-resumo sobre essa amos- 
tra reduzida. A extensão de perda de dados diminuiu 
consideravelmente graças à eliminação de 6 casos (me- 
nos que 10% da amostra) e uma variável. Agora, metade 
da amostra tem dados completos, apenas duas variáveis 
têm mais de 10% de dados perdidos, e as variáveis não- 
métricas contam todas com dados completos. Além dis- 
so, o maior número de valores perdidos para qualquer 
caso é dois, o que indica que a atribuição não deve afetar 
qualquer caso de maneira substancial. 


Tendo eliminado seis casos e uma variável, a extensão 
de dados perdidos é ainda grande o bastante para justi- 
ficar a ida para o passo 3 e diagnosticar a aleatoriedade 
dos padrões de perda de dados. Essa análise será limitada 
às variáveis métricas, pois as não-métricas agora não têm 
perda de dados. 


Passo 3: Diagnóstico da aleatoriedade 

do processo de perda de dados 

O próximo passo é um exame empírico dos padrões de da- 
dos perdidos, para determinar se estes estão distribuídos 
ao acaso pelos casos e pelas variáveis. É melhor se os dados 
perdidos forem considerados MCAR, permitindo assim 
uma gama maior de ações corretivas no processo de atri- 
buição. Empregaremos primeiramente um teste de com- 
paração entre grupos de casos perdidos e não-perdidos, e 
então conduziremos um teste geral de aleatoriedade. 

O primeiro teste para avaliar aleatoriedade é compa- 
rar as observações com e sem dados perdidos para cada 
variável com relação às outras variáveis. Por exemplo, as 
observações com dados perdidos em V, são colocadas em 
um grupo, e as observações com respostas válidas para 
V, são dispostas em um outro grupo. Em seguida, esses 
dois grupos são comparados para identificar diferenças 
nas demais variáveis métricas (V, a V5). Uma vez que 
tenham sido feitas comparações em todas as variáveis, 
novos grupos são formados com base nos dados perdidos 
da variável seguinte (V,), e as comparações são nova- 
mente feitas nas variáveis restantes. Esse processo conti- 
nua até que cada variável (V, a Vs; lembre-se que V, foi 


TABELA 2-3 Estatísticas-resumo de dados perdidos para a amostra original 


Dados perdidos 


Número de Desvio 
Variável casos Média padrão Número Percentual 
V, 49 4,0 0,93 21 30 
V, 57 1,9 0,93 13 19 
V, 53 8,1 1,41 17 24 
V, 63 5,2 11,17 rá 10 
A 61 2,9 0,78 9 13 
VA 84 2,6 0,72 6 9 
A 61 6,8 1,68 9 13 
Vs 61 46,0 9,36 9 13 
Y 63 4,8 0,83 7 10 
Vo 68 NA NA 2 3 
V, 68 NA NA 2 3 
Vo 68 NA NA 2 3 
Via 69 NA NA 1 1 
Via 68 NA NA 2 3 


NA = Não aplicável a variáveis não-métricas 


Resumo de casos 


Número de dados 
perdidos por caso 


Número de casos 


Percentual da amostra 


0 26 37 

1 15 21 

2 19 27 

3 4 6 

7 6 9 
Total 70 100% 


CAPÍTULO 2 Exame de seus Dados 71 
TABELA 2-4 Padrões de perda de dados por caso 
Padrões de dados perdidos 
Quantia Percentual 
Caso perdida perdido V, V, V, V, A Vs V, Vs Y Vo V,. Voo Vis Va 
205 1 74 S 
202 2 14,3 s S 
250 2 14,3 s S 
255 2 14,3 s S 
269 2 14,3 Ss S 
238 1 74 s 
240 1 74 s 
253 1 74 s 
256 1 74 s 
259 1 74 Ss 
260 1 74 Ss 
228 2 14,3 Ss Ss 
246 1 74 s 
225 2 14,3 S s 
267 2 14,3 S s 
222 2 14,3 S Ss 
241 2 14,3 S Ss 
229 1 74 Ss 
216 2 14,3 s Ss 
218 2 14,3 s Ss 
232 2 14,3 s S 
248 2 14,3 s S 
237 1 74 S 
249 1 74 S 
220 1 74 S 
213 2 14,3 S S 
257 2 14,3 S S 
203 2 14,3 S S 
231 1 7,1 S 
219 2 14,3 S Ss 
244 1 7,1 Ss 
227 2 14,3 S S 
224 3 21,4 s S Ss 
268 1 74 s 
235 2 14,3 S s 
204 3 21,4 s S Ss 
207 3 21,4 Ss S Ss 
221 3 21,4 s S S 
245 7 50,0 s S Ss S S S S 
233 7 50,0 S S Ss s Ss S Ss 
261 7 50,0 S S Ss S S s s 
210 7 50,0 S Ss s S S Ss S 
263 7 50,0 S S S Ss Ss S S Ss 
214 7 50,0 s S s S S s S 


Nota: Somente casos com dados perdidos são mostrados. 


S = dados perdidos 
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TABELA 2-5 Padrões de perda de dados 


Padrões de perda de dados 


Número 
de casos V, V, V, V, VA A V, 


Número de casos 
completos se 
variáveis com o 
padrão de dados 
perdidos não 
Y Vo V, Vo Vis Va são usadas 


No 
[o)) 


x 


x 


x 


XxX XxX x x 


x 


x x 
XxX X x x x 
x 


X x 
x X x 
X X X X 


X XxX x x 


da INDO O O O a CEE ÁS O OND ID CDC TD E O AS ces 
XxX x x 


XxX X x x 


x 
x 
X 


x 


26 

27 

37 

32 

34 

27 

30 

30 

27 

35 

37 

29 

32 

31 

27 

29 

27 

31 

x 40 
x 27 
28 

40 

39 

x x 47 

x x X 38 
40 
x X 34 
x 37 

x x 38 


x 
x 


Notas: Representa o número de casos com cada padrão de dados perdidos. Por exemplo, lendo de cima para baixo a coluna para os primeiros três valores (26, 1 e 
4), 26 casos não são dados perdidos sobre qualquer variável. Então, 1 caso é de dado perdido em V,. Em seguida, 4 casos são de dados perdidos sobre duas variá- 


veis (V, e V,;). 


excluída) tenha sido examinada para qualquer diferença. 
O objetivo é identificar qualquer processo sistemático de 
dados perdidos que apareceria em padrões de diferenças 
significantes. 


A Tabela 2-7 contém os resultados para essa análise das 
64 observações restantes. O único padrão observável de 
valores t significantes ocorre em V,, na qual três das oito 
comparações (V,, V; e V;) apontaram para diferenças 
significantes entre os dois grupos. Além disso, apenas 


uma outra instância (grupos formados sobre V, e com- 
parados sobre V,) mostrou uma diferença significativa. 
Essa análise indica que, apesar de diferenças significan- 
tes poderem ser encontradas devido aos dados perdidos 
em uma variável (V,), os efeitos são limitados somente 
a essa variável, tornando-a de interesse marginal. Se 
testes posteriores de aleatoriedade indicassem um pa- 
drão não-aleatório de dados perdidos, esses resultados 
forneceriam um ponto de partida para possíveis ações 
corretivas. 
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TABELA 2-6 Estatísticas-resumo para amostra reduzida (seis casos e V, eliminada) 


Dados perdidos 


Número Desvio 

de casos Média padrão Número Percentual 
V, 54 1,9 0,86 10 16 
VA 50 8,1 1,32 14 22 
V, 60 5,1 1,19 4 6 
Vi 59 2,8 0,75 5 8 
V, 63 2,6 0,72 1 2 
V 60 6,8 1,68 4 6 
VA 60 46,0 9,42 4 6 
V, 60 4,8 0,82 4 6 
Vo 64 0 0 
V 64 0 0 
Vo 64 0 0 
Via 64 0 0 
Va 64 0 0 


NA = Não aplicável a variáveis não-métricas 


Resumo de casos 


Número de dados 
perdidos por caso 


Número de casos 


Percentual da amostra 


0 32 

18 

2 14 

Total 64 


50 
28 
22 


100 


O teste final é um teste geral dos dados perdidos para 
detectar MCAR. O teste faz uma comparação do real pa- 
drão de dados perdidos com o que se esperaria se os da- 
dos perdidos fossem distribuídos totalmente ao acaso. O 
processo MCAR de perda de dados é indicado por um ní- 
vel estatístico não-significante (p. ex., maior do que 0,05), 
revelando que o padrão observado não difere de um ale- 
atório. Tal teste é executado no módulo Análise de Valor 
Perdido do SPSS, bem como em outros pacotes computa- 
cionais que lidam com análise de perda de valores. 


Neste caso, o teste MCAR de Little tem um nível de 
significância de 0,583, indicando uma diferença não- 
significante entre o padrão de dados perdidos observa- 
dos na amostra reduzida e um padrão aleatório. Este 
resultado, acoplado com a análise anterior mostrando 
diferenças mínimas em um padrão não-aleatório, per- 
mite que o processo de perda de dados seja considerado 
MCAR. Como resultado, o pesquisador pode empregar 
qualquer uma das ações corretivas para perda de dados, 
pois não existe qualquer viés potencial nos padrões de 
dados perdidos. 


Passo 4: Seleção de um método de atribuição 

Como discutido anteriormente, diversos métodos de atri- 
buição estão disponíveis tanto para processos MCAR quan- 
to MAR. Neste caso, o processo MCAR de perda de dados 
viabiliza o uso de qualquer um dos métodos de atribuição. 
O outro fator a ser considerado é a extensão de dados per- 
didos. À medida que o nível de perda de dados aumenta, 
métodos como o de informação completa se tornam menos 
interessantes, devido a restrições no tamanho da amostra, 
enquanto os métodos de disponibilidade total, de regressão 
e baseados em modelos se mostram preferíveis. 


A primeira opção é usar apenas observações com dados 
completos. A vantagem dessa abordagem de manter 
consistência na matriz de correlação é, porém, compen- 
sada neste caso por sua redução da amostra para um 
tamanho tão pequeno (32 casos) que se torna inútil em 
análises posteriores. As próximas opções ainda são o uso 
de somente dados válidos, através do método de dispo- 
nibilidade total, ou calcular valores de substituição por 
meio de métodos como a substituição pela média, a téc- 
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TABELA 2-7 Avaliação da aleatoriedade dos dados perdidos através de comparações de grupos de observações 
com dados perdidos versus válidos 


Grupos formados por dados 


perdidos em: V, V, V, V, VA V A Y, 
V, Valor t ; 0,7 -2,2 —4,2 -2,4 -1,2 -1,1 —1,2 
Significância : 0,528 0,044 0,001 0,034 0,260 0,318 0,233 
Número de casos (dados válidos) 54 42 50 49 53 51 52 50 
Número de casos (dados perdidos) 0 8 10 10 10 9 8 10 
Média de casos (dados válidos) 1,9 8,2 5,0 2,7 2,5 6,7 45,5 4,8 
Média de casos (dados perdidos) ; 7,9 5,9 3,5 3,1 74 49,2 5,0 
V, Valor t 1,4 : 1,1 2,0 0,2 0,0 1,9 0,9 
Significância 0,180 ; 0,286 0,066 0,818 0,965 0,073 0,399 
Número de casos (dados válidos) 42 50 48 47 49 47 46 48 
Número de casos (dados perdidos) 12 0 12 12 14 13 14 12 
Média de casos (dados válidos) 2,0 8,1 5,2 2,9 2,6 6,8 47,0 4,8 
Média de casos (dados perdidos) 1,6 5 4,8 2,4 2,6 6,8 42,5 4,6 
V, Valor t 2,6 —0,3 ; 0,2 1,4 Ts 0,2 -2,4 
Significância 0,046 0,785 á 0,888 0,249 0,197 0,830 0,064 
Número de casos (dados válidos) 50 48 60 55 59 56 56 56 
Número de casos (dados perdidos) 4 2 0 4 4 4 4 4 
Média de casos (dados válidos) 1,9 8,1 5,1 2,8 2,6 6,8 46,0 4,8 
Média de casos (dados perdidos) 1,3 8,4 , 2,8 2,3 6,2 45,2 54 
V, Valor t —0,3 0,8 0,4 5 —0,9 —0,4 0,5 0,6 
Significância 0,749 0,502 0,734 j 0,423 0,696 0,669 0,605 
Número de casos (dados válidos) 49 47 55 59 58 55 55 55 
Número de casos (dados perdidos) 5 3 5 0 5 5 5 5 
Média de casos (dados válidos) 1,9 8,2 5,2 2,8 2,6 6,8 46,2 4,8 
Média de casos (dados perdidos) 2,0 74 5,0 ; 2,9 ZA 43,6 4,6 
V Valor t 0,9 0,2 -2,1 0,9 -1,5 ; 0,5 0,4 
Significância 0,440 0,864 0,118 0,441 0,193 : 0,658 0,704 
Número de casos (dados válidos) 51 47 56 55 59 60 57 56 
Número de casos (dados perdidos) 3 3 4 4 4 0 3 4 
Média de casos (dados válidos) 1,9 8,1 5,1 2,9 2,6 6,8 46,1 4,8 
Média de casos (dados perdidos) 1,5 8,0 6,2 2,5 2,9 42,7 4,7 
Va Valor t —1,4 2,2 —1,1 =,9 —1,8 1,7 ; 1,6 
Significância 0,384 0,101 0,326 0,401 0,149 0,128 ; 0,155 
Número de casos (dados válidos) 52 46 56 55 59 57 60 56 
Número de casos (dados perdidos) 2 4 4 4 4 3 0 4 
Média de casos (dados válidos) 1,9 8,3 5,1 2,8 2,6 6,8 46,0 4,8 
Média de casos (dados perdidos) 3,0 6,6 5,6 3;1 3,0 6,3 ; 4,5 
Ya Valor t 0,8 -2,1 2,5 2,17 1,3 0,9 2,4 ; 
Significância 0,463 0,235 0,076 0,056 0,302 0,409 0,066 j 
Número de casos (dados válidos) 50 48 56 55 60 56 56 60 
Número de casos (dados perdidos) 4 2 4 4 3 4 4 0 
Média de casos (dados válidos) 1,9 8,1 5,2 2,9 2,6 6,8 46,4 4,8 
Média de casos (dados perdidos) 1,6 9,2 3,9 2; 2,2 6,3 39,5 


, 


Notas: Cada célula contém seis valores: (1) Valor t para a comparação das médias da variável coluna ao longo dos grupos formados entre 
o grupo a (casos com dados válidos na variável linha) e grupo b (observações com dados perdidos na variável linha); (2) significância do 

valor t para comparações de grupos; (3) e (4) número de casos para o grupo a (dados válidos) e para o grupo b (dados perdidos); (5) e (6) 
média da variável coluna para o grupo a (dados válidos na variável linha) e para o grupo b (dados perdidos na variável linha) 
Interpretação da tabela: A célula no canto superior direito indica que um valor t para a comparação de V, entre o grupo a (dados válidos 
sobre V,) e o grupo b (dados perdidos em V,) é —1,2, o que tem um nível de significância de 0,233. Os tamanhos das amostras dos grupos 
aeb são, respectivamente, 50 e 10. Finalmente, a média do grupo a (dados válidos em V,) é 4,8, enquanto a média do grupo b (dados 


perdidos em V,) é 5,0. 
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Uma recapitulação da análise de valores perdidos 
Nossa avaliação das questões que envolvem dados perdi- 
dos no conjunto de dados pode ser resumida em quatro 
conclusões: 


(Continuação) 
nica baseada em regressão, ou mesmo uma abordagem 
de construção de modelo (p. ex., método EM). Pelo fato 


de os dados perdidos serem MCAR, todos esses méto- 
dos serão empregados e então comparados para avaliar 
as diferenças que surgem entre técnicas. Eles poderiam 
também formar a base para uma estratégia de atribuição 
múltipla na qual todos os resultados são combinados em 
um único resultado geral. 

A Tabela 2-8 detalha os resultados da estimativa de 
médias e desvios padrão por quatro métodos de atribui- 
ção (substituição pela média, disponibilidade total, re- 
gressão e EM). Ao comparar médias, descobrimos uma 
consistência geral entre as abordagens, sem padrões 
perceptíveis. Para os desvios padrão, contudo, podemos 
ver a redução de variância associada com o método de 
substituição pela média. Por todas as variáveis, ele con- 
sistentemente fornece o menor desvio padrão, o que é 
atribuído à substituição por um valor constante. Os ou- 
tros três métodos novamente exibem uma consistência 
nos resultados, indicativa da falta de viés em qualquer 
uma das metodologias, uma vez que o processo de perda 
de dados foi considerado MCAR. 

Finalmente, a Tabela 2-9 contém as correlações ob- 
tidas das abordagens de atribuição de caso completo, 
disponibilidade total, substituição pela média e EM. Na 
maioria dos casos, as correlações são parecidas, mas há 
várias diferenças substanciais. Primeiro, há uma consis- 
tência entre as correlações obtidas com as abordagens de 
disponibilidade total, da substituição pela média e EM. 
No entanto, diferenças consistentes ocorrem entre esses 
valores e aqueles do método de caso completo. Segundo, 
as diferenças notáveis estão concentradas nas correlações 
de V, e V,, as duas variáveis com a maior quantia de da- 
dos perdidos na amostra reduzida (olhe novamente a Ta- 
bela 2-6). Essas diferenças podem indicar o impacto de 
um processo de dados perdidos, ainda que o teste geral 
de aleatoriedade não tenha mostrado qualquer padrão 
significante. Apesar de o pesquisador não possuir qual- 
quer prova de maior validade para qualquer tratamento, 
esses resultados demonstram as diferenças marcantes 
que às vezes ocorrem entre as abordagens. Qualquer que 
seja a metodologia escolhida, o pesquisador deve exami- 
nar as correlações obtidas por métodos alternativos para 
compreender a amplitude de possíveis valores. 


A tarefa do pesquisador é fundir os padrões de perda 
de dados com os pontos fortes e fracos de cada abordagem, 
e então selecionar o método mais apropriado. No caso de 
diferentes estimativas, a abordagem mais conservadora de 
combinar as estimativas em uma só (a técnica de atribuição 
múltipla) pode ser a melhor escolha. Qualquer que seja o 
método empregado, o conjunto de dados com valores de 
substituição deve ser armazenado para análise posterior. 


e O processo de dados perdidos é MCAR. Todas as téc- 
nicas diagnósticas apóiam a conclusão de que nenhum 
processo sistemático de dados perdidos existe, o que 
torna os dados perdidos MCAR (perdidos completa- 
mente ao acaso). Tal descoberta dá duas vantagens ao 
pesquisador. Primeiro, não deve haver qualquer impac- 
to “oculto” sobre os resultados que precise ser consi- 
derado quando interpretamos os resultados. Segundo, 
qualquer método de atribuição pode ser aplicado como 
ação corretiva nos dados perdidos. A seleção dos mes- 
mos não precisa ser baseada em suas habilidades para 
lidar com processos não-aleatórios, mas sim na aplicabi- 
lidade do processo e seu impacto sobre os resultados. 

e A atribuição é o curso de ação mais lógico. Mesmo 
quando é dado o benefício de eliminar casos e variá- 
veis, o pesquisador está prevenido contra a solução 
simples de usar o método de caso completo, pois isso 
resulta em um tamanho de amostra inadequado. Por- 
tanto, alguma forma de atribuição se faz necessária 
para manter um tamanho de amostra adequado para 
qualquer análise multivariada. 

e As correlações atribuídas diferem de acordo com as 
técnicas. Ao estimar as correlações entre as variáveis 
na presença de dados perdidos, o pesquisador pode 
escolher entre quatro técnicas mais comumente em- 
pregadas: o método de caso completo, a técnica de 
disponibilidade total, a abordagem de substituição 
pela média e EM. No entanto, essa situação o pesqui- 
sador se depara com diferenças nos resultados entre 
esses métodos. As abordagens de disponibilidade to- 
tal, substituição pela média e EM conduzem a resulta- 
dos geralmente consistentes. Não obstante, diferenças 
notáveis são encontradas entre essas abordagens e 
o método de disponibilidade completa. Apesar de o 
método de disponibilidade completa parecer mais “se- 
guro” e conservador, não é recomendado neste caso 
devido à pequena amostra empregada (apenas 26 ob- 
servações) e às suas grandes diferenças em relação aos 
outros dois métodos. O pesquisador deve escolher, se 
necessário, entre os outros tratamentos. 

e Múltiplos métodos para substituir os dados perdidos estão 
disponíveis e são apropriados. Como mencionado acima, 
a substituição pela média é um meio aceitável para gerar 
valores de substituição para os dados perdidos. O pes- 
quisador também tem à sua disposição os métodos de 
regressão e de atribuição EM, cada um dos quais gera 
estimativas razoavelmente consistentes para a maioria 
das variáveis. A presença de diversos métodos aceitáveis 
também permite ao pesquisador combinar as estimativas 
em uma única composição, na esperança de minimizar 
qualquer efeito decorrente de um dos métodos. 
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TABELA 2-8 Comparação das estimativas da média e do desvio padrão nos quatro métodos de 


atribuição 

Médias estimadas 
Método de atribuição V, V, V, V, VA V, V, VA 
Substituição pela média 1,90 8,13 5,15 2,84 2,60 6,79 45,97 4,80 
Disponibilidade total 1,90 8,13 5,15 2,84 2,60 6,79 45,97 4,80 
Regressão 1,99 8,11 5,14 2,83 2,58 6,84 45,81 4,77 
EM 2,00 8,34 5,17 2,88 2,54 6,72 47,72 4,85 


Desvios padrão estimados 


Método de atribuição V, V, V, V, V A V A 

Substituição pela média 0,79 1,16 1,15 0,72 0,71 1,62 9,12 0,79 
Disponibilidade total 0,86 1,32 1,19 0,75 0,72 1,67 9,42 0,82 
Regressão 0,87 1,26 1,16 0,75 0,73 1,67 9,28 0,81 
EM 0,84 1,21 1,11 0,69 0,72 1,69 9,67 0,88 


TABELA 2-9 Comparação de correlações obtidas com os métodos de atribuição de caso 
completo (LISTWISE), disponibilidade total (PAIRWISE), substituição pela média e EM 


V, V, V, V, V, v, V, V, 
V, 1,00 
1,00 
1,00 
1,00 
V, -0,29 1,00 
-0,36 1,00 
-0,29 1,00 
-0,32 1,00 
v, 028 -007 1,00 


0,30  —0,07 1,00 
0,24  —0,06 1,00 
0,30  —0,09 1,00 
VA 0,29 0,25 0,26 1,00 
0,44 0,05 0,43 1,00 
0,38 0,04 0,42 1,00 
0,48 0,07 0,41 1,00 
VA 0,35 -0,09 0,82 0,31 1,00 
0,26  -0,06 0,81 0,34 1,00 
0,22 -—003 0,77 0,32 1,00 
0,80 -0,07 0,80 0,38 1,00 
A 0,34 -0,41 0,422 -—003 0,54 1,00 
0,35 -0,36 0,40 0,07 0,40 1,00 
0,31 -0,29 0,37 0,06 0,40 1,00 
0,35 -0,30 0,40 0,03 0,41 1,00 
VA 0,01 0,72 0,20 0,71 0,26  —0,27 1,00 
0,15 0,60 0,22 0,71 0,27 —0,20 1,00 
0,13 0,50 0,21 0,66 0,26  —0,20 1,00 
0,17 0,54 0,20 0,68 0,27 -0,19 1,00 


Y -0,27 0,77 0,21 0,46 0,09 -043 0,71 1,00 
-0,18 0,70 0,38 0,53 0,23 —0,26 0,67 1,00 
-0,17 0,63 0,34 0,48 0,23 —0,25 0,65 1,00 
—0,08 0,61 0,36 0,55 0,24 —0,24 0,67 1,00 


Interpretação: O valor no topo é a correlação obtida com o método de caso completo, o segundo valor é conse- 
guido com a abordagem de disponibilidade total, o terceiro valor é derivado da substituição pela média, e a quarta 
correlação resulta do método EM. 
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Concluindo, as ferramentas analíticas e os processos 
diagnósticos apresentados na seção anterior fornecem 
uma base adequada para a compreensão e acomodação 
dos dados perdidos encontrados nos dados pré-examina- 
dos. Como este exemplo demonstra, o pesquisador não 
precisa temer que os dados perdidos sempre impedirão 
uma análise multivariada ou que sempre limitarão a ge- 
neralidade dos resultados. O possível impacto “oculto” 
de dados perdidos pode ser identificado, e ações podem 
ser tomadas para minimizar o efeito de dados perdidos na 
análise executada. 


Resumo 


Os procedimentos disponíveis para lidar com dados per- 
didos variam em forma, complexidade e propósito. O 
pesquisador sempre deve estar preparado para avaliar e 
lidar com dados perdidos, já que estes frequentemente 
são encontrados em análise multivariada. A decisão de 
usar apenas observações com dados completos pode pa- 
recer conservadora e “segura”, mas, como foi ilustrado na 
discussão anterior, há limitações inerentes e vieses nesses 
tratamentos. Nenhum método único é adequado para to- 
das as situações; o pesquisador deve fazer um julgamento 
racional da situação, considerando todos os fatores des- 
critos nesta seção. O processo de quatro passos fornece 
ao pesquisador, esperamos, uma metodologia estruturada 
para identificação e correção de padrões de perda de da- 
dos da forma mais adequada. 


OBSERVAÇÕES ATÍPICAS 


Observações atípicas são observações com uma combi- 
nação única de características identificáveis como sendo 
notavelmente diferentes das outras observações. O que 
constitui uma característica única? Tipicamente consi- 
dera-se como um valor incomum em uma variável por 
ser alto ou baixo, ou uma combinação ímpar de valores 
ao longo de diversas variáveis que tornam a observação 
marginal em relação às outras. Ao se avaliar o impacto 
de observações atípicas, devemos considerar aspectos 
práticos e substantivos: 


e De um ponto de vista prático, observações atípicas podem 
ter um efeito sensível sobre qualquer tipo de análise empíri- 
ca. Por exemplo, considere uma amostra de 20 indivíduos na 
qual queremos determinar a renda média familiar. Em nossa 
amostra reunimos respostas que variam entre R$20.000,00 e 
R$100.000,00 ao ano, de modo que a média é de R$45.000,00 
por ano. Mas considere que a 21º pessoa tem uma renda de 
R$1 milhão ao ano. Se incluirmos esse valor na análise, a 
renda média aumenta para mais de R$90.000,00. Natural- 
mente que a observação atípica é um caso válido, mas qual 
é a melhor estimativa de renda familiar média: R$45.000,00 
ou R$90.000,00? O pesquisador deve avaliar se o valor mar- 
ginal deve ser mantido ou eliminado, devido à sua influência 
indevida sobre os resultados. 


e Em termos substantivos, a observação atípica deve ser vista 
sob a óptica do quão representativa ela é na população. No- 
vamente, usando nosso exemplo de renda familiar, qual é a 
representatividade do milionário no segmento mais abasta- 
do? Se o pesquisador percebe que é um segmento peque- 
no mas viável na população, então talvez o valor deva ser 
mantido. Se, porém, esse milionário é o único na população 
inteira e verdadeiramente representa um valor extremo aci- 
ma de todos (i.e., é um caso ímpar), então o mesmo deve ser 
eliminado. 


Observações atípicas não podem ser categoricamen- 
te caracterizadas como benéficas ou problemáticas, mas 
devem ser vistas no contexto da análise e avaliadas pelos 
tipos de informação que possam fornecer. Caso sejam be- 
néficas, as observações atípicas — apesar de diferentes da 
maioria da amostra — podem ser indicativas de caracterís- 
ticas da população que não seriam descobertas no curso 
normal da análise. Em contraste, as problemáticas não 
são representativas da população, são contrárias aos ob- 
jetivos da análise e podem distorcer seriamente os testes 
estatísticos. Devido à variabilidade no impacto de obser- 
vações atípicas, é imperativo que o pesquisador examine 
os dados, buscando observações atípicas para averiguar 
seu tipo de influência. O leitor também deve consultar as 
discussões do Capítulo 4, que se refere ao tópico de obser- 
vações influentes. Nessas discussões, as observações atípi- 
cas são colocadas em uma estrutura particularmente ade- 
quada para avaliar a influência de observações individuais 
e para determinar se essa influência é útil ou prejudicial. 

Por que ocorrem observações atípicas? Elas podem 
ser divididas em quatro classes baseadas na fonte de suas 
peculiaridades. 


e A primeira classe surge de um erro de procedimento, como 
erro na entrada de dados ou uma falha na codificação. Essas 
observações atípicas devem ser identificadas no estágio de 
limpeza de dados, mas se permanecerem algumas, elas de- 
vem ser eliminadas ou registradas como valores perdidos. 

e A segunda classe de observação atípica é aquela que ocorre 
como o resultado de um evento extraordinário, o que então 
explica a peculiaridade da observação. Por exemplo, consi- 
dere que estamos acompanhando a média de chuvas diárias, 
quando temos um furacão que dura por vários dias e regis- 
tra níveis de queda de água extremamente elevados. Esses 
níveis de chuva não são comparáveis com qualquer outro 
período com padrões meteorológicos normais. Se forem in- 
cluídos, eles mudarão drasticamente o padrão dos resulta- 
dos. O pesquisador deve decidir se o evento extraordinário 
se ajusta aos propósitos da pesquisa. Se for o caso, a obser- 
vação atípica deve ser mantida na análise. Caso contrário, 
deve ser eliminada. 

e A terceira classe refere-se a observações extraordinárias 
para as quais o pesquisador não tem explicação. Em tais ca- 
sos, um padrão único e muito diferente emerge. Apesar de 
essas observações atípicas serem as que têm mais probabi- 
lidade de serem eliminadas, poderão ser mantidas se o pes- 
quisador sentir que elas representam um segmento válido 
da população. Talvez elas representem um elemento emer- 
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gente, ou um elemento novo previamente não-identificado. 
Aqui o pesquisador deve usar seu discernimento no proces- 
so de decisão sobre eliminação ou manutenção. 

e A quarta e última classe de observações atípicas contém ob- 
servações que estão no intervalo usual de valores para cada 
variável. Essas observações não são particularmente altas ou 
baixas nas variáveis, mas são únicas em sua combinação de 
valores entre as variáveis. Em tais situações, o pesquisador 
deve reter a observação, a não ser que exista uma evidência 
específica que desconsidere a observação atípica como um 
membro válido da população. 


Detecção e procedimento 
com observações atípicas 


As seções a seguir detalham os métodos usados para de- 
tectar observações atípicas em situações univariadas, biva- 
riadas e multivariadas. Uma vez identificadas, elas podem 
ser caracterizadas para ajudar a colocá-las em uma entre 
as quatro classes descritas. Finalmente, o pesquisador 
deve decidir sobre a retenção ou exclusão de cada obser- 
vação atípica, julgando não apenas a partir das suas carac- 
terísticas, mas também a partir dos objetivos da análise. 


Métodos para detecção de observações atípicas 

As observações atípicas podem ser identificadas sob uma 
perspectiva univariada, bivariada ou multivariada com 
base no número de variáveis (características) considera- 
das. O pesquisador deve utilizar tantas perspectivas quan- 
to possível, procurando por um padrão consistente nos 
métodos para identificar observações atípicas. A discus- 
são que se segue detalha os processos envolvidos em cada 
uma das três perspectivas. 


Detecção univariada. A identificação univariada de ob- 
servações atípicas examina a distribuição de observações 
para cada variável na análise e seleciona como atípicos 
aqueles casos que estão nos extremos (altos e baixos) dos 
intervalos da distribuição. A questão principal é estabele- 
cer a base para designação de uma observação atípica. A 
abordagem usual primeiro converte os valores dos dados 
em escores padrão, que têm uma média de O e um desvio 
padrão de 1. Como os valores são expressos em um formato 
padronizado, é fácil fazer comparações entre as variáveis. 

Em qualquer caso, o pesquisador deve reconhecer 
que um certo número de observações pode ocorrer nor- 
malmente nesses externos da distribuição. O pesquisador 
deve tentar identificar apenas as observações verdadeira- 
mente diferentes e designá-las como atípicas. 


Detecção bivariada. Além da avaliação univariada, pa- 
res de variáveis podem ser avaliados conjuntamente por 
meio de um diagrama de dispersão. Casos que notoria- 
mente estão fora do intervalo das outras observações 
serão percebidos como pontos isolados no diagrama de 
dispersão. Para auxiliar na determinação do intervalo es- 
perado de observações neste retrato bidimensional, uma 


elipse representando um intervalo especificado de con- 
fiança (tipicamente marcado em um nível de 90 ou 95%) 
para uma distribuição normal bivariada é sobreposta ao 
diagrama de dispersão. Isso fornece uma descrição grá- 
fica dos limites de confiança e facilita a identificação das 
observações atípicas. Uma variante do diagrama de dis- 
persão chama-se gráfico de influência, com cada ponto 
variando de tamanho em relação a sua influência sobre 
a relação. 

Cada um desses métodos fornece uma avaliação da 
unicidade de cada observação em relação à outra obser- 
vação com base em um par específico de variáveis. Uma 
desvantagem do método bivariado em geral é o número 
potencialmente grande de diagramas de dispersão que 
aparecem quando o número de variáveis aumenta. Para 
três variáveis, são apenas três gráficos para todas as com- 
parações dois a dois. Mas para cinco variáveis, exigem- 
se 10 gráficos; e para 10 variáveis, são 45 diagramas de 
dispersão. Como resultado, o pesquisador deve limitar o 
uso geral de métodos bivariados para relações específicas 
entre variáveis, tais como a relação de variáveis depen- 
dentes versus independentes em regressão. O pesquisador 
pode então examinar o conjunto de gráficos de dispersão 
e identificar qualquer padrão de uma ou mais observações 
que resultaria em sua designação como atípica. 


Detecção multivariada. Pelo fato de a maioria das análi- 
ses multivariadas envolver mais do que duas variáveis, os 
métodos bivariados rapidamente se tornam inadequados 
por diversas razões. Primeiro, eles requerem um grande 
número de gráficos, como discutido anteriormente, quando 
o número de variáveis atinge até mesmo um tamanho mo- 
derado. Segundo, eles são limitados a duas dimensões (va- 
riáveis) por vez. No entanto, quando mais de duas variáveis 
são consideradas, o pesquisador precisa de uma maneira de 
objetivamente medir a posição multidimensional de cada 
observação relativamente a algum ponto comum. Este pro- 
blema é abordado pela medida Dº de Mahalanobis, uma 
avaliação multivariada de cada observação ao longo de um 
conjunto de variáveis. Este método mede a distância de 
cada observação em um espaço multidimensional a partir 
do centro médio de todas as observações, fornecendo um 
único valor para cada observação, independentemente do 
número de variáveis em questão. Valores mais elevados de 
Dº representam observações muito afastadas da distribui- 
ção geral de observações neste espaço multidimensional. 
Tal técnica, porém, tem também a desvantagem de forne- 
cer somente uma avaliação geral, de modo que ela não ofe- 
rece qualquer visão pormenorizada sobre quais variáveis 
poderiam conduzir a um elevado valor de D”, 

Para fins de interpretação, a medida D” de Mahalano- 
bis tem propriedades estatísticas que viabilizam teste de 
significância. A medida D” dividida pelo número de va- 
riáveis envolvidas (D”/df) é aproximadamente distribuída 
como um valor t. Dada a natureza dos testes estatísticos, 
sugere-se o uso de níveis conservadores de significância (p. 
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ex., 0,005 ou 0,001) como valores de referência para desig- 
nação como valor atípico. Assim, observações que têm um 
valor D'/df excedendo 2,5 em pequenas amostras e 3 ou 4 
em grandes amostras podem ser designadas como possí- 
veis observações atípicas. Uma vez identificada como um 
potencial caso atípico com a medida D”, uma observação 
pode ser reexaminada em termos dos métodos univaria- 
dos e bivariados discutidos anteriormente, para uma com- 
preensão mais completa da natureza de sua peculiaridade. 


Designação de observação atípica 

Com esses métodos diagnósticos univariados, bivariados 
e multivariados, o pesquisador tem um conjunto comple- 
mentar de perspectivas com o qual examinar observações 
quanto ao seu status como atípicas. Cada um desses méto- 
dos pode fornecer uma perspectiva única sobre as obser- 
vações e pode ser utilizado de uma maneira combinada 
para identificar casos atípicos (ver Regras Práticas 2-4). 


REGRAS PRÁTICAS 2-4 


Detecção de observações atípicas 


e Métodos univariados: Examine todas as variáveis para 
identificar observações únicas ou extremas. 

e Para pequenas amostras (80 observações ou menos), 
observações atípicas geralmente são definidas como 
casos com escores padrão de 2,5 ou mais. 

Para amostras maiores, aumente o valor de 
referência de escores padrão para até 4. 

Se escores padrão não são usados, identifique casos 
que recaiam fora dos intervalos de desvio padrão de 
2,5 versus 4, dependendo do tamanho da amostra. 

Métodos bivariados: Concentre seu uso em relações 

específicas de variáveis, como o caso independente 

versus dependente. 

e Use diagramas de dispersão com intervalos de 
confiança em um nível alfa especificado. 

Métodos multivariados: Mais adequados para examinar 

uma variável estatística completa, como as variáveis 

independentes na regressão ou as variáveis na análise 
fatorial. 

e Níveis de referência para as medidas D'/df devem 
ser conservadores (0,005 ou 0,001), resultando em 
valores de 2,5 (amostras pequenas) versus 3 ou 4 em 
amostras maiores. 


Quando observações são identificadas pelos métodos 
univariados, bivariados e multivariados como possíveis 
casos atípicos, o pesquisador deve então escolher apenas 
observações que demonstrem real notoriedade em com- 
paração com o restante da população ao longo de tantas 
perspectivas quanto seja possível. O pesquisador deve 
evitar a designação de muitas observações como atípicas 
e não pode sucumbir à tentação de eliminar aqueles casos 
inconsistentes com os demais casos simplesmente por se- 
rem diferentes. 


Descrição e perfil de observações atípicas 

Uma vez que observações atípicas potenciais tenham sido 
identificadas, o pesquisador deve gerar perfis sobre cada 
uma delas e identificar a(s) variável(eis) responsável(eis) 
por sua condição de atipicidade. Além desse exame visual, 
o pesquisador também pode empregar técnicas multiva- 
riadas, como análise discriminante (Capítulo 5) ou regres- 
são múltipla (Capítulo 4), para identificar as diferenças 
entre as observações atípicas e as demais. Se possível, ele 
deve designar a observação atípica a uma entre as quatro 
classes descritas anteriormente para ajudar na decisão de 
retenção ou eliminação a ser feita a seguir. O pesquisador 
deve continuar essa análise até estar satisfeito com a com- 
preensão dos aspectos do caso que diferenciam a observa- 
ção atípica das demais. 


Retenção ou eliminação da observação atípica 
Depois que as observações atípicas foram identificadas, 
descritas e classificadas, o pesquisador deve decidir sobre 
a retenção ou eliminação de cada uma. Entre os pesqui- 
sadores há muitas filosofias sobre como lidar com as ob- 
servações atípicas. Nossa visão é de que elas devem ser 
mantidas, a menos que exista prova demonstrável de que 
estão verdadeiramente fora do normal e que não são re- 
presentativas de quaisquer observações na população. No 
entanto, se elas representam um elemento ou segmento da 
população, devem ser mantidas para garantir generalida- 
de à população como um todo. Se as observações atípicas 
são eliminadas, o pesquisador corre o risco de melhorar 
a análise multivariada, mas limitar sua generalidade. Se 
as observações atípicas são problemáticas em uma técnica 
particular, muitas vezes podem ser acomodadas na análise 
de uma maneira que não a distorçam seriamente. 


Um exemplo ilustrativo de análise 
de observações atípicas 


Como exemplo de detecção de observação atípica, as ob- 
servações da base de dados HBAT introduzida no Capí- 
tulo 1 são examinadas aqui no que se refere a observações 
atípicas. As variáveis consideradas na análise são as va- 
riáveis métricas X, a X,,, com o contexto de nosso exa- 
me sendo uma análise de regressão, onde X, é a variável 
dependente e X, a X,, são as variáveis independentes. A 
análise de observação atípica inclui diagnósticos univaria- 
do, bivariado e multivariado. Se candidatos a observações 
atípicas são encontrados, eles são examinados e uma deci- 
são sobre retenção ou eliminação é tomada. 


Detecção de observação atípica 

O primeiro passo é examinar todas as variáveis sob uma 
perspectiva univariada. Métodos bivariados serão então 
empregados para examinar as relações entre a variável 
dependente (X,,) e cada uma das independentes. A partir 
de cada um desses diagramas de dispersão, observações 
que ficam fora da distribuição típica podem ser identifi- 
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cadas, e então seu impacto sobre aquela relação pode ser 
avaliado. Finalmente, uma avaliação multivariada será fei- 
ta sobre todas as variáveis independentes coletivamente. 
Comparações de observações pelos três métodos devem, 
espera-se, fornecer a base para a decisão sobre elimina- 
ção/retenção. 


13) permite a identificação de observações atípicas através 
de um teste aproximado de significância estatística. Como 
a amostra tem apenas 100 observações, um valor de refe- 
rência de 2,5 será usado no lugar do valor de 3,5 ou 4,0 
utilizado em grandes amostras. Com essa base, duas obser- 


Detecção univariada. O primeiro passo é examinar as 
observações em cada variável individualmente. A Tabe- 
la 2-10 contém as observações com valores padronizados 
que excedem +2,5 em cada uma das variáveis (X, a X,9). 
Dessa perspectiva univariada, somente as observações 
7, 22 e 90 excedem o valor referência em mais de uma 
variável. Além disso, nenhuma dessas observações tem 
valores tão extremos a ponto de afetar qualquer uma das 
medidas gerais das variáveis, como a média ou o desvio 
padrão. Devemos observar que a variável dependente 
tinha uma observação atípica (22), a qual pode afetar os 
diagramas de dispersão bivariados, pois a variável de- 
pendente aparece em cada diagrama. As três observa- 
ções serão notadas para ver se elas aparecem nas avalia- 
ções bivariadas e multivariadas subseqiientes. 


Detecção bivariada. Para uma perspectiva bivariada, 
13 diagramas de dispersão são formados para cada uma 
das variáveis independentes (X, a X,,) com a variável 
dependente (X,5). Uma elipse representando o intervalo 
de confiança de 95% de uma distribuição normal biva- 
riada é então sobreposta ao diagrama de dispersão. A 
Figura 2-7 contém exemplos de tais diagramas de disper- 
são envolvendo X, e X,. Como podemos ver no diagra- 
ma de dispersão para X, com X,,, as duas observações 
atípicas ficam logo fora da elipse e não têm os valores 
em qualquer variável. Este resultado está em contraste 
com o diagrama de dispersão de X, com X,,, onde a ob- 
servação 22 é sensivelmente diferente das demais e exi- 
be os mais altos valores sobre X, e X,, A segunda parte 
da Tabela 2-10 contém uma compilação das observações 
que estão fora dessa elipse para cada variável. Uma vez 
que é um intervalo de confiança de 95%, esperam-se al- 
gumas observações normalmente fora da elipse. Apenas 
quatro observações (2, 22, 24 e 90) estão fora da elipse 
mais de duas vezes. A observação 22 está fora em 12 dos 
13 diagramas de dispersão, principalmente por ser uma 
observação atípica sobre a variável dependente. Das três 
observações restantes, apenas a 90 foi notada na detec- 
ção univariada. 


Detecção multivariada. O método de diagnóstico final é 
avaliar observações atípicas multivariadas com a medida 
D” de Mahalanobis (ver Tabela 2-10). Essa análise avalia 
a posição de cada observação comparativamente com o 
centro de todas as observações sobre um conjunto de va- 
riáveis. Neste caso, todas as variáveis independentes mé- 
tricas foram empregadas. O cálculo do valor D'/df (df = 


vações (98 e 36) são identificadas como significativamente 
diferentes. É interessante que essas observações não foram 
percebidas em análises univariadas e bivariadas anteriores, 
mas aparecem apenas nos testes multivariados. Este resul- 
tado indica que elas não são únicas em uma variável isola- 
da, mas são únicas em combinação de variáveis. 


Retenção ou eliminação das observações atípicas 
Como resultado desses testes diagnósticos, nenhuma ob- 
servação demonstra as características de observações atípi- 
cas que deviam ser eliminadas. Cada variável tem algumas 
observações que são extremas e devem ser consideradas 
se aquela variável é usada em uma análise. Nenhuma ob- 
servação é extrema em um número suficiente de variáveis 
para ser considerada não-representativa da população. Em 
todos os casos, as observações designadas como atípicas, 
mesmo com os testes multivariados, parecem semelhantes 
o suficiente com as demais observações para serem retidas 
na análise multivariada. No entanto, o pesquisador sempre 
deve examinar os resultados de cada técnica multivariada 
específica para identificar observações que possam vir a ser 
atípicas naquela aplicação em particular. No caso da análi- 
se de regressão, o Capítulo 4 fornecerá métodos adicionais 
para avaliar a influência relativa de cada observação e ga- 
rantir uma visão aprimorada sobre a possível eliminação 
de uma observação como atípica. 


TESTE DAS SUPOSIÇÕES DA 
ANALISE MULTIVARIADA 


O último passo no exame de dados envolve o teste das su- 
posições inerentes às bases estatísticas da análise multiva- 
riada. Os primeiros passos da análise de perda de dados e 
de detecção de observações atípicas tentaram limpar os da- 
dos para um formato mais adequado para análise multiva- 
riada. Testar os dados quanto à concordância com as supo- 
sições estatísticas inerentes às técnicas multivariadas agora 
lida com a fundamentação sobre a qual as técnicas fazem 
inferências estatísticas e obtêm resultados. Algumas técni- 
cas são menos afetadas pela violação de certas suposições, o 
que se chama de robustez, mas, em todos os casos, atender 
algumas das suposições será crítico para uma análise bem- 
sucedida. Logo, é necessário entender o papel desempenha- 
do pelas suposições para cada técnica multivariada. 

A necessidade de testar as suposições estatísticas au- 
menta em aplicações multivariadas por duas características 
da análise multivariada. Primeiro, a complexidade das re- 
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TABELA 2-10 Resultados de detecção de observação atípica univariada, bivariada e multivariada 


ATÍPICAS UNIVARIADAS ATÍPICAS BIVARIADAS ATÍPICAS MULTIVARIADAS 
Casos com valores Casos fora da elipse Casos com um valor 
padronizados do intervalo de de D'/df maior do 
excedendo +2,5 confiança de 95% que 2,5 (df = 13) 

X, com: Caso [Dá D'Idf 
X Sem casos X 44,90 98 40,0 3,08 
X, 13, 22, 90 X, 13, 22, 24, 53, 90 36 36,9 2,84 
Xa 8,7 X 22,87 
X Sem casos X 2,22,45,52 
Xo Sem casos Xo 22, 24, 85 
X, 7 X, 2, 7,22,45 
Xo 90 X 22, 44,90 
Xs Sem casos Xs 22,57 
Xu 77 Xu 22, 77,84 
Xs 6,53 Xs 6, 22,53 
Xe 24 Xe 22, 24, 48, 62, 92 
Xy Sem casos Xy 22 
Ka 7,84 Xe 2,7,22,84 
Xo 22 


“Valor D? de Mahalanobis baseado nas 13 percepções HBAT (X, a X,;). 


FIGURA 2-7 Diagramas de dispersão selecionados para detecção bivariada de 
observações atípicas: X, (Qualidade do produto) e X; (Atividades de comércio 
eletrônico) com X,s (Satisfação do cliente). 
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lações, devido ao uso costumeiro de um grande número de 
variáveis, torna as distorções potenciais e vieses mais signi- 
ficativos quando as suposições são violadas, particularmen- 
te quando as violações se compõem para se tornarem mais 
prejudiciais do que se consideradas separadamente. Se- 
gundo, a complexidade das análises e dos resultados pode 
mascarar os “sinais” de violações de suposições, aparentes 
nas análises univariadas mais simples. Em quase todos os 
casos, os procedimentos multivariados estimam o modelo 
multivariado e produzem resultados mesmo quando as su- 
posições são severamente violadas. Assim, o pesquisador 
deve estar ciente de qualquer violação de suposições e das 
implicações que elas possam ter no processo de estimação 
ou na interpretação dos resultados. 


Avaliação de variáveis individuais 
versus a variável estatística 


A análise multivariada requer que as suposições subjacen- 
tes às técnicas estatísticas sejam testadas duas vezes: pri- 
meiro, para as variáveis separadas, de modo semelhante 
aos testes para uma análise univariada e, segundo, para a 
variável estatística do modelo multivariado, a qual atua 
coletivamente para as variáveis na análise, e, assim, deve 
atender às mesmas suposições das variáveis individuais. 
Este capítulo se concentra no exame de variáveis indivi- 
duais para atendimento das suposições subjacentes aos 
procedimentos multivariados. Discussões em cada capítulo 
abordam os métodos usados para avaliar as suposições ine- 
rentes à variável estatística em cada técnica multivariada. 


Quatro suposições estatísticas importantes 


Técnicas multivariadas e suas contrapartes univariadas 
são todas baseadas em um conjunto fundamental de su- 
posições representando as exigências da teoria estatística 
inerente. Apesar de muitas premissas ou exigências sur- 
girem em uma ou mais técnicas multivariadas que discu- 
timos no texto, quatro delas potencialmente afetam toda 
técnica estatística univariada e multivariada. 


Normalidade 
A suposição mais fundamental em análise multivariada é 
a normalidade, a qual se refere à forma da distribuição de 
dados para uma variável métrica individual e sua corres- 
pondência com a distribuição normal, o padrão de refe- 
rência para métodos estatísticos. Se a variação em relação 
à distribuição normal é suficientemente grande, todos os 
testes estatísticos resultantes são inválidos, uma vez que a 
normalidade é exigida no emprego das estatísticas Fe t. Os 
métodos estatísticos univariado e multivariado discutidos 
neste texto baseiam-se na suposição de normalidade uni- 
variada, com os métodos multivariados também assumin- 
do normalidade multivariada. 

A normalidade univariada para uma única variável 
é facilmente testada, e várias medidas corretivas são vi- 


áveis, como será demonstrado posteriormente. Em um 
sentido simples, normalidade multivariada (a combinação 
de duas ou mais variáveis) significa que as variáveis indi- 
viduais são normais em um sentido univariado e que suas 
combinações também são normais. Logo, se uma variá- 
vel é normal multivariada, também é normal univariada. 
No entanto, a recíproca não é necessariamente verdadeira 
(duas ou mais variáveis normais univariadas não são ne- 
cessariamente normais multivariadas). Assim, uma situa- 
ção em que todas as variáveis exibem uma normalidade 
univariada ajuda a obter, apesar de não garantir, a nor- 
malidade multivariada. Normalidade multivariada é mais 
difícil de testar [13,23], mas há testes especializados dis- 
poníveis para situações nas quais a técnica multivariada 
é particularmente afetada por uma violação dessa suposi- 
ção. Na maioria dos casos avaliar e conseguir normalidade 
univariada para todas as variáveis é suficiente, e aborda- 
remos normalidade multivariada somente quando ela for 
especialmente crítica. Mesmo quando grandes amostras 
tendem a diminuir os efeitos nocivos da não-normalidade, 
o pesquisador deve sempre avaliar a normalidade em to- 
das as variáveis métricas incluídas na análise. 


Avaliação do impacto da violação da suposição de norma- 
lidade. A severidade da não-normalidade se baseia em 
duas dimensões: a forma da distribuição transgressora e 
o tamanho da amostra. Como veremos na discussão que 
se segue, o pesquisador não deve apenas julgar a extensão 
sobre a qual a distribuição da variável é não-normal, mas 
também os tamanhos de amostra envolvidos. O que po- 
deria ser considerado inaceitável com amostras pequenas 
terá um efeito pífio em amostras maiores. 


Impactos decorrentes da forma de distribuição. 
Como podemos descrever a distribuição se ela difere da 
normal? A forma de qualquer distribuição pode ser des- 
crita por duas medidas: curtose e assimetria. Curtose se 
refere à “elevação” ou “achatamento” da distribuição 
comparada com a normal. Distribuições que são mais al- 
tas ou mais pontiagudas do que o normal são chamadas 
de leptocúrticas, enquanto uma distribuição que seja mais 
achatada é denominada de platicúrtica. Enquanto a curto- 
se se refere à altura da distribuição, a assimetria é empre- 
gada para descrever o equilíbrio da distribuição; ou seja, 
ela é desequilibrada ou deslocada para um lado (direita 
ou esquerda), ou é centrada e simétrica com aproxima- 
damente o mesmo formato em ambos os lados? Se uma 
distribuição é desequilibrada, ela é assimétrica. Uma as- 
simetria positiva denota uma distribuição deslocada para 
a esquerda, enquanto uma assimetria negativa reflete um 
desvio para a direita. 

Saber como descrever a distribuição é seguido pela 
questão de como determinar a extensão ou quantia em 
relação à qual ela difere nessas características. Tanto as- 
simetria quanto curtose têm medidas empíricas que estão 
disponíveis em todos os programas estatísticos. Na maio- 
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ria dos programas de computador, à assimetria e à curtose 
de uma distribuição normal são dados os valores zero. Em 
seguida, valores acima ou abaixo de zero denotam desvios 
da normalidade. Por exemplo, valores negativos de curto- 
se indicam uma distribuição platicúrtica (mais achatada), 
enquanto valores positivos denotam uma distribuição lep- 
tocúrtica (pontiaguda). Analogamente, valores positivos 
de assimetria indicam a distribuição deslocada à esquer- 
da, e valores negativos correspondem a um desvio à direi- 
ta. Para julgar a questão “São grandes o bastante para me 
preocupar?” sobre os valores, a discussão a seguir sobre 
testes estatísticos mostra como os valores de curtose e as- 
simetria podem ser transformados para refletirem a signi- 
ficância estatística das diferenças e oferecerem diretrizes 
quanto à sua severidade. 


Impactos causados pelo tamanho da amostra.  Ain- 
da que seja importante compreender como a distribuição 
se desvia da normalidade em termos de formato e se esses 
valores são grandes o bastante para garantir atenção, o 
pesquisador deve também considerar os efeitos do tama- 
nho da amostra. Como discutido no Capítulo 1, o tama- 
nho da amostra tem o efeito de aumentar poder estatís- 
tico por redução de erro de amostragem. Isso resulta em 
um efeito semelhante aqui, no sentido de que amostras 
maiores reduzem os efeitos nocivos da não-normalidade. 
Em amostras pequenas de 50 ou menos observações, e es- 
pecialmente se o tamanho da amostra é menor do que 30, 
desvios significantes da normalidade podem ter um im- 
pacto substancial sobre os resultados. Para amostras com 
200 ou mais observações, porém, esses mesmos efeitos 
podem ser negligenciados. Além disso, quando compara- 
ções de grupos são feitas, como na ANOVA, os diferentes 
tamanhos de amostras entre grupos, se forem grandes o 
suficiente, podem até mesmo cancelar os efeitos nocivos. 
Assim, na maioria dos casos, à medida que tamanhos de 
amostras se tornam grandes, o pesquisador pode ficar 
menos preocupado com variáveis não-normais, exceto no 
caso em que elas possam conduzir a outras violações de 
suposições que tenham impacto de outras maneiras (p.ex., 
ver a discussão a seguir sobre homocedasticidade). 


Análises gráficas de normalidade. O teste diagnóstico 
de normalidade mais simples é uma verificação visual do 
histograma que compara os valores de dados observados 
com uma distribuição aproximadamente normal (ver Fi- 
gura 2-1). Apesar de atraente por causa de sua simplicida- 
de, este método é problemático para amostras menores, 
nas quais a construção do histograma (p. ex., o número de 
categorias ou a extensão de categorias) pode distorcer a 
descrição visual a ponto de a análise ser inútil. Uma abor- 
dagem mais confiável é o gráfico de probabilidade normal, 
que compara a distribuição cumulativa de valores de dados 
reais com a distribuição cumulativa de uma distribuição 
normal. A distribuição normal forma uma reta diagonal, 
e os dados do gráfico são comparados com a diagonal. Se 


uma distribuição é normal, a linha que representa a distri- 
buição real dos dados segue muito próxima à diagonal. 

A Figura 2-8 exibe diversos desvios da normalidade 
e sua representação na probabilidade normal em termos 
de curtose e assimetria. Primeiro, desvios da distribuição 
normal em termos de curtose são facilmente percebidos 
nos gráficos de probabilidade normal. Quando a linha 
reta fica abaixo da diagonal, a distribuição é mais acha- 
tada do que o esperado. Quando está acima da diagonal, 
a distribuição é mais elevada do que a curva normal. Por 
exemplo, no gráfico de probabilidade normal de uma dis- 
tribuição elevada (Figura 2-8d), percebemos uma curva 
com um formato nítido de S. Inicialmente, a distribuição é 
mais achatada e a linha no gráfico fica abaixo da diagonal. 
Em seguida, a parte elevada da distribuição rapidamente 
move a linha acima da diagonal, e por fim a linha nova- 
mente desvia para abaixo da diagonal conforme a distri- 
buição se achata. Uma distribuição sem elevação tem o 
padrão oposto (Figura 2-8c). Assimetria é também facil- 
mente percebida, mais frequentemente representada por 
um arco simples, ou acima ou abaixo da diagonal. Uma 
assimetria negativa (Figura 2-8e) é indicada por um arco 
abaixo da diagonal, enquanto um arco acima da diagonal 
representa uma distribuição positivamente assimétrica 
(Figura 2-8f). Uma excelente fonte para interpretar grá- 
ficos de probabilidade normal, que mostra os vários pa- 
drões e as interpretações, é o livro de Daniel e Wood [7]. 
Esses padrões específicos não apenas identificam não-nor- 
malidade, mas também nos dizem a forma da distribuição 
original e a ação corretiva apropriada a aplicar. 


Testes estatísticos de normalidade. Além de examinar 
o gráfico de probabilidade normal, pode-se usar testes 
estatísticos para avaliar a normalidade. Um teste simples 
é uma regra prática baseada nos valores de assimetria e 
curtose (disponíveis como parte das estatísticas descriti- 
vas básicas para uma variável e computadas por todos os 
programas estatísticos). O valor estatístico (z) para a assi- 
metria é calculado como: 


assimetria 
6 


N 


EAR ETIR 
assimetria 


onde N é o tamanho da amostra. Um valor z também 
pode ser calculado para a curtose usando a fórmula: 
curtose 

24 


N 


Z = 
curtose 


Se o valor z calculado exceder o valor crítico especifica- 
do, então a distribuição é não-normal em termos daquela 
característica. O valor crítico é de uma distribuição z, ba- 
seado no nível de significância que desejamos. Os valores 
críticos mais comumente usados são + 2,58 (nível de signi- 
ficância de 0,01) e + 1,96, que corresponde a um nível de 
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FIGURA 2-8 Gráficos de probabilidade normal e distribuições univariadas correspondentes. 


erro de 0,05. Com esses testes simples, o pesquisador pode 
facilmente avaliar o grau em que a assimetria e curtose da 
distribuição variam em relação à distribuição normal. 

Testes estatísticos específicos também estão dispo- 
níveis em todos os programas estatísticos. Os dois mais 
comuns são o teste Shapiro-Wilks e uma modificação do 
teste de Kolmogorov-Smirnov. Cada um calcula o nível 
de significância para as diferenças em relação a uma dis- 
tribuição normal. O pesquisador sempre deve lembrar 
que os testes de significância são menos úteis em amostras 
pequenas (menos que 30) e muito sensíveis em amostras 
grandes (que excedem 1000 observações). Logo, o pesqui- 
sador sempre deve usar testes gráficos e testes estatísticos 
para avaliar o grau real de desvio da normalidade. 


Ações corretivas para não-normalidade. Diversas trans- 
formações de dados disponíveis para acomodar distri- 
buições não-normais são discutidas posteriormente no 
capítulo. Este capítulo restringe a discussão para testes 
de normalidade univariada e transformações. No entan- 


to, quando examinamos outros métodos multivariados, 
como a regressão multivariada ou a análise multivariada 
de variância, também discutimos testes para normalidade 
multivariada. Além disso, muitas vezes, quando a não- 
normalidade é apontada, ela também contribui para ou- 
tras violações de suposições; portanto, remediar norma- 
lidade pode auxiliar no atendimento a outras suposições. 
(Para os interessados em normalidade multivariada, ver 
[13,16,25].) 


Homocedasticidade 

A próxima suposição refere-se a relações de dependên- 
cia entre variáveis. Homocedasticidade se refere à su- 
posição de que as variáveis dependentes exibem níveis 
iguais de variância ao longo do domínio da(s) variável(is) 
preditora(s). A homocedasticidade é desejável porque a 
variância da variável dependente sendo explicada na re- 
lação de dependência não deveria se concentrar apenas 
em um domínio limitado dos valores independentes. Na 
maioria das situações, temos muitos valores diferentes da 
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variável dependente em cada valor da variável indepen- 
dente. Para que essa relação seja completamente captura- 
da, a dispersão (variância) dos valores da variável depen- 
dente deve ser relativamente semelhante em cada valor da 
variável preditora. Se essa dispersão for desigual ao longo 
de valores da variável independente, a relação é dita hete- 
roscedástica. Apesar de as variáveis dependentes deverem 
ser métricas, esse conceito de igual extensão de variância 
entre as variáveis independentes pode ser aplicado quan- 
do as variáveis independentes são métricas ou não. 


e Variáveis independentes métricas. O conceito de homoce- 
dasticidade se baseia na extensão da variância da variável 
dependente no domínio dos valores das variáveis indepen- 
dentes, o que se encontra em técnicas como a regressão 
múltipla. A dispersão de valores para a variável dependente 
deve ser tão grande para pequenos valores das variáveis in- 
dependentes quanto o é para variáveis com valores modera- 
dos ou grandes. Em um diagrama de dispersão, isso é visto 
como uma distribuição elíptica de pontos. 

e Variáveis independentes não-métricas. Nessas análises (p. 
ex., ANOVA e MANOVA) o foco agora se torna a igual- 
dade da variância (uma só variável dependente) ou das ma- 
trizes de variância/covariância (múltiplas variáveis depen- 
dentes) nos grupos formados pelas variáveis independentes 
não-métricas. A igualdade das matrizes de variância/cova- 
riância também é vista na análise discriminante, mas nessa 
técnica a ênfase é na dispersão das variáveis independentes 
nos grupos formados pela medida dependente não-métrica. 


Em todos esses casos, o objetivo é o mesmo: garantir que 
a variância usada na explicação e previsão esteja distri- 
buída no domínio de valores, permitindo assim um “teste 
justo” da relação entre todos os valores das variáveis não- 
métricas. As duas fontes mais comuns de heteroscedasti- 
cidade são as seguintes: 


e Tipo de variável. Muitos tipos de variáveis têm uma tendên- 
cia natural a diferenças na dispersão. Por exemplo, quando 
uma variável aumenta em valor (p. ex., unidades que variam 
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(a) Homoscedasticidade 


de algo próximo a zero até milhões), há um intervalo natu- 
ralmente maior de possíveis respostas para os valores maio- 
res. Também, quando porcentuais são usados, a tendência 
natural é para muitos valores estarem no meio do domínio, 
com poucos casos nos valores menores ou maiores. 

e Distribuição assimétrica de uma ou mais variáveis. Na Figu- 
ra 2-9a, os diagramas de dispersão de pontos de dados para 
duas variáveis (V, e V,), com distribuições normais, exibem 
igual dispersão em todos os valores dos dados (ou seja, ho- 
mocedasticidade). No entanto, na Figura 2-9b, percebemos 
dispersão desigual (heteroscedasticidade) provocada por 
assimetria de uma das variáveis (V,). Para os diferentes va- 
lores de V,;, há diferentes padrões de dispersão para V.. 


O resultado da heteroscedasticidade é causar melho- 
res previsões em alguns níveis da variável independente 
do que em outros. Essa variabilidade afeta os erros pa- 
drões e torna os testes de hipóteses muito restritos ou in- 
sensíveis. O efeito da heteroscedasticidade também está 
frequentemente relacionado ao tamanho da amostra, es- 
pecialmente quando se examina a dispersão de variância 
em grupos. Por exemplo, em ANOVA ou MANOVA, o 
impacto da heteroscedasticidade sobre o teste estatístico 
depende dos tamanhos de amostra associados com os gru- 
pos de menores e maiores variâncias. Em análise de re- 
gressão múltipla, efeitos semelhantes ocorreriam em dis- 
tribuições altamente assimétricas onde houvesse números 
desproporcionais de respondentes em certos intervalos da 
variável independente. 


Testes gráficos de igual dispersão de variância. O tes- 
te de homocedasticidade para duas variáveis métricas é 
mais bem examinado graficamente. Desvios de uma igual 
dispersão são mostrados por formas como cones (disper- 
são pequena em um lado do gráfico, dispersão grande no 
lado oposto) ou losangos (um grande número de pontos 
no centro da distribuição). A aplicação mais comum de 
testes gráficos ocorre em regressão múltipla, com base na 
dispersão da variável dependente nos valores de qualquer 
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FIGURA 2-9 Diagramas de dispersão de relações homoscedásticas e heteroscedásticas. 
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uma das variáveis independentes. Vamos adiar nossa dis- 
cussão sobre métodos gráficos até chegarmos ao Capítulo 
4, o qual descreve esses procedimentos com muito mais 
detalhes. 

Os gráficos de caixas funcionam bem para representar 
o grau de variação entre grupos formados por uma va- 
riável categórica. O comprimento da caixa e os whiskers 
retratam, cada um, a variação dos dados dentro daque- 
le grupo. Assim, heteroscedasticidade seria retratada 
por diferenças substanciais no comprimento das caixas e 
whiskers entre grupos que representam a dispersão de ob- 
servações em cada grupo. 


Testes estatísticos para homocedasticidade. Os testes 
estatísticos para igual dispersão de variância avaliam a 
igualdade de variâncias dentro de grupos formados por 
variáveis não-métricas. O teste mais comum, teste Leve- 
ne, é usado para avaliar se as variâncias de uma única va- 
riável métrica são iguais em qualquer número de grupos. 
Se mais do que uma variável métrica está sendo testada, 
de forma que a comparação envolve a igualdade de matri- 
zes de variância/covariância, o teste M de Box é aplicável. 
O teste M de Box está disponível tanto na análise multi- 
variada de variância quanto na análise discriminante, e é 
discutido mais detalhadamente em capítulos posteriores 
que tratam dessas técnicas. 


Ações corretivas para heteroscedasticidade. As variá- 
veis heteroscedásticas podem ser remediadas por meio 
de transformações de dados semelhantes às empregadas 
para atingir a normalidade. Como anteriormente mencio- 
nado, muitas vezes a heteroscedasticidade é o resultado 
da não-normalidade de uma das variáveis, e correção da 
não-normalidade também remedia a dispersão desigual 
da variância. Uma seção adiante discute as transforma- 
ções de dados das variáveis para “espalharem” a variância 
e fazer com que todos os valores tenham um efeito poten- 
cialmente igual na previsão. 


Linearidade 

Uma suposição implícita em todas as técnicas multivaria- 
das baseadas em medidas correlacionais de associação, 
incluindo regressão múltipla, regressão logística, análise 
fatorial, e modelagem de equações estruturais, é a lineari- 
dade. Como as correlações representam apenas a associa- 
ção linear entre variáveis, os efeitos não-lineares não serão 
representados no valor de correlação. Essa omissão resulta 
em uma subestimação da força real da relação. É sempre 
prudente examinar todas as relações para identificar des- 
vios de linearidade que possam afetar a correlação. 


Identificação de relações não-lineares. O modo mais 
comum de avaliar a linearidade é examinar diagramas de 
dispersão das variáveis e identificar qualquer padrão não- 
linear nos dados. Muitos programas de diagramas de dis- 
persão podem mostrar a linha reta que descreve a relação 
linear, permitindo ao pesquisador uma melhor identifica- 


ção de qualquer característica não-linear. Um tratamento 
alternativo é executar uma análise de regressão simples 
(os detalhes sobre essa técnica são cobertos no Capítulo 
4) e examinar os resíduos. Os resíduos refletem a parte 
inexplicada da variável dependente; logo, qualquer parte 
não-linear da relação aparecerá nos resíduos. Uma tercei- 
ra abordagem é explicitamente modelar uma relação não- 
linear pelo teste de especificações de modelo alternativo 
(também conhecido como ajuste de curva) que reflitam os 
elementos não-lineares. Uma discussão desse tratamento 
e de análise de resíduos se encontra no Capítulo 4. 


Ações corretivas para não-linearidade. Se uma relação 
não-linear é detectada, a abordagem mais direta é trans- 
formar uma ou as duas variáveis de modo a obter linea- 
ridade. Várias transformações disponíveis são discutidas 
posteriormente neste capítulo. Uma alternativa à trans- 
formação de dados é a criação de novas variáveis para re- 
presentar a porção não-linear da relação. O processo de 
criação e interpretação dessas variáveis adicionais, que 
pode ser usado em todas as relações lineares, é discutido 
no Capítulo 4. 


Ausência de erros correlacionados 

As previsões em qualquer técnica de dependência não são 
perfeitas, e raramente encontramos uma situação na qual 
elas sejam. Contudo, certamente tentamos garantir que 
qualquer erro de previsão seja não-correlacionado. Por 
exemplo, se encontramos um padrão que sugere que todos 
os outros erros são positivos, enquanto os termos de erro 
alternativo são negativos, sabemos que alguma relação 
sistemática inexplicada existe na variável dependente. Se 
tal situação ocorre, não podemos confiar na idéia de que 
nossos erros de previsão são independentes dos níveis nos 
quais estamos tentando prever. Algum outro fator está 
afetando os resultados, mas não está incluído na análise. 


Identificação de erros correlacionados. Uma das viola- 
ções mais comuns da suposição de que os erros são não- 
correlacionados deve-se ao processo de coleta de dados. 
Fatores semelhantes que afetam um grupo podem não 
afetar o outro. Se os grupos são analisados separadamen- 
te, os efeitos são constantes dentro de cada grupo e não 
impactam a estimação da relação. Entretanto, se as obser- 
vações dos dois grupos são combinadas, então a relação 
estimada final deve ser um meio-termo entre as duas rela- 
ções reais. Isso faz com que os resultados sejam viesados, 
porque uma causa não-especificada está afetando a esti- 
mação da relação. 

Outra fonte comum de erros correlacionados são os 
dados em série temporal. Como é de se esperar, os dados 
para qualquer período de tempo estão altamente relacio- 
nados com os dados em momentos anteriores e posterio- 
res. Assim, previsões e erros de previsão estarão neces- 
sariamente correlacionados. Esse tipo de dado conduz à 
criação de programas especializados em análise de séries 
temporais e esse padrão de observações correlacionadas. 
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Para identificar erros correlacionados, o pesquisa- 
dor deve primeiro identificar possíveis causas. Valores 
para uma variável devem ser agrupados ou ordenados 
sobre a variável suspeita e então examinados em busca 
de padrões. Em nosso exemplo anterior, uma vez que a 
causa potencial é identificada, o pesquisador poderia ver 
se diferenças existiam entre os grupos. Encontrar dife- 
renças nos erros de previsão nos dois grupos seria então 
a base para determinar que um efeito não-especificado 
estava “provocando” os erros correlacionados. Para ou- 
tros tipos de dados, como dados em séries temporais, 
podemos ver tendências ou padrões quando ordenamos 
os dados (p. ex., por período de tempo para séries tem- 
porais). Essa variável de ordenação (tempo, neste caso), 
se não incluída na análise de alguma maneira, causaria 
a correlação dos erros e criaria vieses substanciais nos 
resultados. 


Ações corretivas para erros correlacionados. Os erros 
correlacionados devem ser corrigidos pela inclusão do 
fator causal omitido na análise multivariada. Em nosso 
exemplo anterior, o pesquisador acrescentaria uma variá- 
vel que indicasse em qual classe os respondentes estavam. 
A correlação mais comum é o acréscimo de uma variá- 
vel (ou mais) à análise, que represente o fator omitido. A 
tarefa-chave do pesquisador não é propriamente a ação 
corretiva, mas a identificação do efeito não-especificado e 
um meio de representá-lo na análise. 


Visão geral de teste para suposições estatísticas. O 
pesquisador encara aquilo que pode parecer uma tarefa 
impossível: satisfazer todas essas suposições estatísti- 
cas ou correr o risco de uma análise falha e com vieses. 
Queremos observar que mesmo que essas suposições 
estatísticas sejam importantes, o pesquisador deve usar 
seu julgamento na interpretação dos testes para cada pre- 
missa e na decisão sobre quando aplicar ações corretivas. 
Mesmo análises com amostras pequenas podem suportar 
pequenos, mas significantes, desvios da normalidade. O 
que é mais importante para o pesquisador é entender as 
implicações de cada premissa em relação à técnica de in- 
teresse, tentando algo intermediário entre a necessidade 
de satisfazer as suposições versus a robustez da técnica e 
contexto de pesquisa. As orientações a seguir nas Regras 
Práticas 2-5 tentam retratar os aspectos mais pragmáticos 
das suposições e as reações que podem ser tomadas pelos 
pesquisadores. 


Transformações de dados 


As transformações de dados fornecem um meio para mo- 
dificar variáveis devido a uma entre duas razões: (1) para 
corrigir violações das suposições estatísticas inerentes às 
técnicas multivariadas, ou (2) para melhorar a relação 
(correlação) entre variáveis. As transformações de dados 
podem ser sustentadas por motivos que são “teóricos” 
(transformações cuja justificativa é baseada na natureza 


REGRAS PRÁTICAS 2-5 


Teste das suposições estatísticas 


Normalidade pode ter sérios efeitos em pequenas 
amostras (com menos de 50 casos), mas o impacto 
diminui efetivamente quando a amostra atinge 200 
casos ou mais. 

A maioria dos casos de heteroscedasticidade são 

um resultado de não-normalidade em uma ou mais 
variáveis; assim, corrigir normalidade* pode não ser 
necessário devido ao tamanho de amostra, mas pode 
ser necessário para igualar a variância. 

Relações não-lineares podem ser bem definidas, mas 
seriamente subestimadas a menos que os dados sejam 
transformados em um padrão linear ou componentes 
de modelo explícito sejam usados para representar a 
porção não-linear da relação. 

Erros correlacionados surgem de um processo que deve 
ser tratado de forma muito parecida com a perda de 
dados; ou seja, o pesquisador deve primeiramente definir 
as causas entre variáveis como internas ou externas 

ao conjunto de dados; se não forem descobertas e 
remediadas, sérios vieses podem acontecer nos resultados, 
muitas vezes desconhecidos pelo pesquisador. 


dos dados) ou “derivados dos dados” (onde as transfor- 
mações são estritamente sugeridas por um exame dos 
dados). Em qualquer caso, o pesquisador deve proceder 
muitas vezes por tentativa e erro, monitorando as melho- 
rias versus a necessidade de transformações adicionais. 

Todas as transformações descritas aqui são facilmente 
executáveis por simples comandos nos pacotes computa- 
cionais estatísticos mais comuns. Concentramo-nos em 
transformações que podem ser computadas dessa manei- 
ra, apesar de métodos mais sofisticados e complicados de 
transformação de dados estarem disponíveis (por exem- 
plo, ver Box e Cox [3]). 


Transformações para atingir 

normalidade e homocedasticidade 

As transformações de dados fornecem os principais meios 
para corrigir a não-normalidade e a heteroscedasticida- 
de. Em ambos os casos, os padrões das variáveis sugerem 
transformações específicas. Para distribuições não-normais, 
os padrões mais comuns são distribuições achatadas e assi- 
métricas. Para a distribuição achatada, a transformação mais 
usual é a inversa (por exemplo, 1/Y ou 1/X). As distribui- 
ções assimétricas podem ser transformadas calculando-se a 
raiz quadrada, logaritmos, quadrados ou cubos (Xº ou Xº), 
ou mesmo o inverso da variável. Geralmente, as distribui- 
ções negativamente assimétricas são melhor transformadas 
empregando-se uma transformação de quadrado ou cubo, 
enquanto o logaritmo ou a raiz quadrada normalmente fun- 


*N. deR.T.: A frase correta seria “corrigir não-normalidade”. 
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cionam melhor em assimetrias positivas. Em muitos casos, o 
pesquisador pode aplicar todas as transformações possíveis 
e então selecionar a variável transformada mais apropriada. 

A heteroscedasticidade é um problema associado, e 
em muitos casos “curar” este problema também lidará 
com questões de normalidade. A heteroscedasticidade 
também ocorre devido à distribuição da(s) variável(is). 
Quando se examina o diagrama de dispersão, o padrão 
mais comum é a distribuição em forma de cone. Se o cone 
abre à direita, considere a inversa; se o cone abre para a 
esquerda, considere a raiz quadrada. Algumas transfor- 
mações podem ser associadas com certos tipos de dados. 
Por exemplo, as contagens de frequência sugerem uma 
transformação de raiz quadrada; as proporções são me- 


lhor transformadas por arco seno [x =2 arcsen /X ; 
novo velho 


e a mudança proporcional é mais fácil de manobrar calcu- 
lando-se o logaritmo da variável. Em todos os casos, uma 
vez que as transformações tenham sido efetuadas, os da- 
dos transformados devem ser testados para ver se a ação 
corretiva desejada foi conseguida. 


Transformações para atingir linearidade 

Existem muitos procedimentos para conseguir linearida- 
de entre duas variáveis, mas as relações não-lineares mais 
simples podem ser classificadas em quatro categorias 
(ver Figura 2-10). Em cada quadrante, as transformações 
potenciais para as variáveis dependente e independente 
são mostradas. Por exemplo, se a relação se parece com 
a da Figura 2-10a, então cada variável pode ser elevada 
ao quadrado para obter linearidade. Quando múltiplas 


Y 


y2 
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possibilidades de transformações forem exibidas, come- 
ce com o método do topo em cada quadrante e vá des- 
cendo até a linearidade ser conseguida. Uma abordagem 
alternativa é usar variáveis adicionais, chamadas de po- 
linômios, para representar as componentes não-lineares. 
Esse método é discutido em mais detalhes no Capítulo 4. 


Orientações gerais para transformações 

Existem muitas possibilidades para transformar os dados 
para atender as suposições estatísticas exigidas. Exceto 
aspectos técnicos do tipo de transformação, diversos pon- 
tos são apresentados nas Regras Práticas 2-6 para lembrar 
quando se deve fazer transformações de dados. 


Uma ilustração do teste das suposições 
inerentes à análise multivariada 


Para ilustrar as técnicas envolvidas no teste dos dados re- 
ferente ao atendimento das suposições inerentes à análise 
multivariada e fornecer uma fundamentação para o uso 
dos dados em capítulos que se seguem, o conjunto de da- 
dos introduzido no Capítulo 1 será examinado. No curso 
da análise, as suposições de normalidade, homocedasti- 
cidade e linearidade serão cobertas. A quarta suposição 
básica, a ausência de erros correlacionados, pode ser dis- 
cutida apenas no contexto de um modelo multivariado es- 
pecífico; ela será abordada em capítulos posteriores para 
cada técnica multivariada. Será enfatizado o exame das 
variáveis métricas, apesar de as variáveis não-métricas se- 
rem avaliadas onde for apropriado. 


(d) 


FIGURA 2-10 Seleção de transformações para atingir linearidade. 
Fonte: F. Mosteller and J. W. Tukey, Data Analysis and Regression. Reading, MA: Addison-Wesley, 1977. 
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REGRAS PRÁTICAS 2-6 


Transformação de dados 


Para julgar o impacto potencial de uma transformação, 
calcule a proporção entre a média da variável e seu 
desvio padrão: 
e Efeitos perceptíveis devem ocorrer quando a 
proporção é menor do que 4. 
Quando a transformação puder ser realizada em 
qualquer uma de duas variáveis, escolha a variável 
com a menor proporção. 
As transformações devem ser aplicadas nas variáveis 
independentes, exceto no caso de heteroscedasticidade. 
A heteroscedasticidade pode ser remediada apenas pela 
transformação da variável dependente em uma relação 
de dependência; se uma relação heteroscedástica é 
também não-linear, a variável dependente, e talvez as 
independentes, deve(m) ser transformada(s). 
As transformações podem mudar a interpretação 
das variáveis; por exemplo, transformar variáveis 
calculando seu logaritmo traduz a relação em uma 
medida de mudança proporcional (elasticidade); 
sempre se assegure de explorar meticulosamente as 
interpretações possíveis das variáveis transformadas. 
Use variáveis em seu formato original (não 
transformadas) quando caracterizar ou interpretar 
resultados. 


quanto às transformações que sejam as melhores, ao 
passo que as características de formato oferecem dire- 
trizes para possíveis transformações. O pesquisador 
pode também usar os gráficos de probabilidade normal 
para identificar a forma da distribuição. A Figura 2-11 
contém os gráficos de probabilidade normal para as seis 
variáveis com distribuições-normais. Por combinação de 
informações, dos métodos empírico e gráfico, o pesqui- 
sador pode caracterizar a distribuição não-normal antes 
de selecionar uma transformação (ver Tabela 2-11 para 
uma descrição de cada distribuição não-normal). 

A Tabela 2-11 também sugere a ação corretiva ade- 
quada para cada uma das variáveis. Duas variáveis (X, 
e X,.) foram transformadas via raiz quadrada*. X, foi 
transformada por logaritmo, enquanto X,, foi eleva- 
da ao quadrado, e X,,, ao cubo. Apenas X,, não pôde 
ser transformada para melhorar suas características de 
distribuição. Para as outras cinco variáveis, seus testes 
de normalidade foram agora ou não-significantes (X,ç 
e X,,), ou sensivelmente melhorados para níveis mais 
aceitáveis (X,, X, e X,;). A Figura 2-12 demonstra o efei- 
to da transformação sobre X,, ao atingir normalidade. A 
X,, transformada aparece muito mais normal nas repre- 
sentações gráficas, e os descritores estatísticos também 
foram melhorados. O pesquisador sempre deve exami- 
nar as variáveis transformadas de maneira tão rigorosa 
quanto às variáveis originais no que se refere a sua nor- 
malidade e formato da distribuição. 


Normalidade No caso da variável remanescente (X,,), nenhuma 
A avaliação de normalidade das variáveis métricas envol- das transformações poderia melhorar a normalidade. 
ve tanto medidas empíricas das características da forma Essa variável deverá ser usada em sua forma original. 
de uma distribuição (assimetria e curtose) quanto gráficos Em situações onde a normalidade das variáveis é críti- 
de probabilidade normal. As medidas empíricas fornecem ca, as variáveis transformadas podem ser empregadas 
uma indicação das variáveis com desvios significantes da com a garantia de que elas atendem as suposições de 
normalidade, e os gráficos de probabilidade normal pro- normalidade. Mas os desvios de normalidade não são 
duzem um retrato visual da forma da distribuição. Os dois tão extremos em qualquer uma das variáveis originais 
tipos de descrições complementam-se quando são selecio- a ponto de jamais poderem ser usados na análise em 
nadas as transformações apropriadas. sua forma original. Se a técnica tem uma robustez para 


desvios da normalidade, então as variáveis originais po- 


. : , dem ser preferenciais para a comparabilidade na fase 
A Tabela 2-11 e a Figura 2-11 contêm as medidas empí- de interpretação. 
ricas e os gráficos de probabilidade normal para as variá- 
veis métricas em nosso conjunto de dados. Nossa primei- 
ra preocupação é sobre as medidas empíricas refletindo 
a forma da distribuição (assimetria e curtose) bem como Homocedasticidade 
um teste estatístico de normalidade (o teste de Kolmo- Todos os pacotes estatísticos têm testes para avaliar a ho- 
gorov-Smirnov modificado). Entre as 17 variáveis métri- mocedasticidade em uma base univariada (p. ex., o teste 
cas, apenas 6 (X,, X, X,,, X,, X,, € X,,) exibem algum de Levene em SPSS) onde a variância de uma variável mé- 
desvio de normalidade nos testes gerais. Quando vemos trica é comparada em níveis de uma variável não-métrica. 
as características de formato, desvios significantes foram Para nossos propósitos, examinamos cada variável métrica 
encontrados para assimetria (X,) e curtose (X,). Deve- ao longo das cinco variáveis não-métricas no conjunto de 
se notar que somente duas variáveis foram encontradas dados. Essas são análises apropriadas na preparação para 
com características de formato diferentes da curva nor- análise de variância, ou análise multivariada de variância, 
mal, enquanto seis variáveis foram identificadas com os 
testes gerais. O teste geral não fornece qualquer idéia * N. de R. T.: Pela Tabela 2-11, as variáveis X, e X,, foram elevadas 

ao quadrado e a X,, ficou na forma inversa. 
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1,00 
0,75 + 
0,50 4 
0,25 + 
0,00 0,00 + t t 
0,00 0,25 0,50 0,75 1,00 0,00 0,25 0,50 0,75 1,00 
Xe Qualidade do produto X; Atividades de comércio eletrônico 
1,00 1,00 
0,75 0,75 + 
0,50 0,50 4 
0,25 0,25 + 
,00 , T , 0,00 ++º-—— , 
0,00 0,25 0,50 0,75 1,00 0,00 0,25 0,50 0,75 1,00 
Xj> Imagem de força de venda X43 Preço competitivo 
1,00 1,00 
0,75 À 0,75 + 
0,50 4 0,50 4 
0,25 À 0,25 + 
0,00 T T T 00 4 T T T 
0,00 0,25 0,50 0,75 1,00 0,00 0,25 0,50 0,75 1,00 
Xe Encomenda e cobrança X17 Flexibilidade de preço 
FIGURA 2-11 Gráficos de probabilidade normal (NPP) de variáveis métricas não-normais (X,, X,, X,, Xja Xi € X). 


nas quais as variáveis não-métricas são as independentes, 
ou para análise discriminante, na qual as variáveis não- 
métricas são as medidas dependentes. 

Os testes para homocedasticidade de duas variáveis 
métricas, encontrados em métodos como regressão múl- 


tipla, são melhor executados por meio de análise gráfica, 
particularmente uma análise dos resíduos. O leitor inte- 
ressado deve ler o Capítulo 4 para uma discussão comple- 
ta da análise de resíduos e dos padrões de resíduos que 
indicam heteroscedasticidade. 
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A Tabela 2-12 contém os resultados do teste Levene 
para cada variável não-métrica. Entre os fatores de de- 
sempenho, apenas X, (Região) tem problemas visíveis 
com heteroscedasticidade. Para as 13 variáveis caracte- 
rísticas da firma, somente X, e X,, apresentam padrões 
de heteroscedasticidade em mais de uma variável não- 
métrica. Além disso, nenhuma variável não-métrica tem 
mais de duas variáveis métricas problemáticas. As impli- 
cações reais desses casos de heteroscedasticidade devem 
ser examinadas sempre que diferenças em grupos forem 
analisadas com o uso de variáveis não-métricas como va- 
riáveis independentes, e essas variáveis métricas, como 
dependentes. A relativa falta de problemas ou de pa- 
drões consistentes ao longo de cada variável não-métrica 
sugere que os problemas de heteroscedasticidade serão 
mínimos. Se forem encontradas violações dessa suposi- 
ção, as transformações de variáveis estarão disponíveis 
para ajudar na correção a dispersão de variância. 

A habilidade de transformações para tratar do pro- 
blema de heteroscedasticidade para X,,, se desejada, 
é também mostrada na Figura 2-12. Antes de aplicar a 
transformação logarítmica, as condições de heterosce- 
dasticidade foram encontradas em três das cinco variá- 
veis não-métricas. A transformação não apenas corrigiu 
o problema de não-normalidade, mas também eliminou 
os problemas de heteroscedasticidade. No entanto, deve 
ser observado que diversas transformações “solucio- 
nam” o problema de normalidade*, mas apenas a trans- 
formação logarítmica também trata da heteroscedasti- 
cidade, o que demonstra a relação entre normalidade 
e heteroscedasticidade e o papel de transformações na 
abordagem de cada questão. 


Linearidade 

A suposição final a ser examinada é a linearidade das re- 
lações. No caso de variáveis individuais, ela se relacio- 
na com os padrões de associação entre cada par de va- 
riáveis e com a capacidade do coeficiente de correlação 
em representar adequadamente a relação. Se relações 
não-lineares são indicadas, então o pesquisador pode 
transformar uma ou ambas as variáveis para conseguir 
linearidade, ou criar variáveis adicionais para represen- 
tar as componentes não-lineares. Para nossos propósitos, 
contamos com a inspeção visual das relações para deter- 
minar se relações não-lineares estão presentes. O leitor 
pode consultar na Figura 2-3 a matriz de dispersão, que 
contém o diagrama de dispersão de variáveis métricas 
selecionadas no conjunto de dados. O exame dos diagra- 
mas de dispersão não revela qualquer relação não-linear 
aparente. Uma revisão dos diagramas de dispersão não 


*N.deR.T.: A palavra correta seria “não-normalidade”. 


exibidos na Figura 2-3 também não revelou qualquer re- 
lação não-linear aparente. Desse modo, transformações 
não são consideradas necessárias. A suposição de lineari- 
dade também será verificada para o modelo multivariado 
como um todo, como se faz no exame de resíduos em 
regressão múltipla. 


Resumo 

A série de testes gráficos e estatísticos usada para avaliar 
as suposições inerentes às técnicas multivariadas revelou 
relativamente pouco em termos de violações das supo- 
sições. Onde as violações se mostraram presentes, elas 
eram relativamente pequenas e não deviam representar 
qualquer problema sério no curso da análise de dados. O 
pesquisador sempre é encorajado a executar esses exames 
simples dos dados, ainda que reveladores, para garantir 
que problemas potenciais possam ser identificados e re- 
solvidos antes que a análise comece. 


INCORPORAÇÃO DE DADOS 
NA O-METRICOS COM 
VARIAVEIS DICOTÔMICAS 


Um fator crítico na escolha e aplicação da técnica mul- 
tivariada correta é cada propriedade de medida das va- 
riáveis dependentes e independentes (ver Capítulo 1 para 
uma discussão mais detalhada sobre a seleção de técni- 
cas multivariadas). Algumas das técnicas, como a análi- 
se discriminante ou a análise multivariada de variância, 
requerem especificamente dados não-métricos como va- 
riáveis dependentes ou independentes. Em muitos casos, 
as variáveis métricas devem ser usadas como variáveis 
independentes, como na análise de regressão, na análi- 
se discriminante e na correlação canônica. Além disso, 
as técnicas de interdependência de análise fatorial e de 
agrupamentos geralmente exigem variáveis métricas. Até 
o momento, todas as discussões têm assumido medidas 
métricas para variáveis. O que podemos fazer quando as 
variáveis são não-métricas, com duas ou mais categorias? 
Variáveis não-métricas, como sexo, estado civil ou pro- 
fissão, têm seu uso proibido em muitas técnicas multiva- 
riadas? A resposta é negativa, e agora discutimos como 
incorporar variáveis não-métricas em muitas dessas situa- 
ções que requerem variáveis métricas. 

O pesquisador tem a sua disposição um método para 
uso de certas variáveis, ditas dicotômicas, as quais atuam 
como variáveis de substituição para a variável não-mé- 
trica. Uma variável dicotômica é aquela que representa 
uma categoria de uma variável independente não-métrica. 
Qualquer variável não-métrica com k categorias pode ser 
representada por k — 1 variáveis dicotômicas. O exemplo 
a seguir ajudará a esclarecer esse conceito. 
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Primeiro, considere que queremos incluir sexo, que tem 
duas categorias, feminino e masculino. Também medi- 
mos o nível de renda familiar por três categorias (ver 
Tabela 2-13). Para representar a variável não-métrica 
sexo, criaríamos duas novas variáveis dicotômicas (X, e 
X,), como mostrado na Tabela 2-13. X, representaria os 
indivíduos do sexo feminino com um valor 1 e daria a 
todos os do sexo masculino o valor O. Do mesmo modo, 
X, representaria todos os indivíduos do sexo masculino 
com o valor 1 e daria aos do sexo feminino o valor 0. As 
duas variáveis (X, e X,) não são necessárias, contudo, 
uma vez que, quando X, = 0, o sexo deve ser feminino 
por definição. Logo, precisamos incluir apenas uma das 
variáveis (X, ou X,) para testar o efeito do sexo. 

De modo semelhante, se também tivéssemos me- 
dido a renda familiar com três níveis, como mostrado 
na Tabela 2-13, definiríamos primeiro três variáveis 
dicotômicas (X,, X, é X,). No caso do sexo, não preci- 
saríamos do conjunto inteiro de variáveis dicotômicas, 
e, em vez disso, usaríamos k — 1 variáveis dicotômicas, 
onde k é o número de categorias. Logo, usaríamos duas 
das variáveis dicotômicas para representar os efeitos da 
renda familiar. 


Ao construir variáveis dicotômicas, duas abordagens po- 
dem ser usadas para representar as categorias, e, mais im- 
portante, a categoria que é omitida, conhecida como cate- 
goria de referência ou grupo de comparação. 


e A primeira abordagem, conhecida como codificação indica- 
dora, usa três maneiras para representar os níveis de renda 
familiar com duas variáveis dicotômicas, como mostrado na 
Tabela 2-14. Uma consideração importante é a categoria de 
referência ou grupo de comparação, a categoria que recebeu 
todos os zeros para as variáveis dicotômicas. Por exemplo, 


na análise de regressão, os coeficientes de regressão para 
as variáveis dicotômicas representam desvios do grupo de 
comparação sobre a variável dependente. Os desvios repre- 
sentam as diferenças entre escores médios da variável de- 
pendente para cada grupo de respondentes (representado 
por uma variável dicotômica) e o grupo de comparação. 
Essa forma é mais apropriada em um grupo de comparação 
lógica, como em um experimento. Em um experimento com 
um grupo de controle que atua como o grupo de compara- 
ção, os coeficientes são as diferenças de médias da variá- 
vel dependente para cada grupo de tratamento em relação 
ao grupo de controle. Sempre que a codificação de variá- 
vel dicotômica é usada, devemos estar cientes do grupo de 
comparação e lembrar dos impactos que ele tem em nossa 
interpretação das demais variáveis. 

e Um método alternativo de codificação de variáveis dico- 
tômicas se chama codificação de efeitos. É o mesmo que 
codificação indicadora, exceto que o grupo de comparação 
(o grupo que tem todos os zeros na codificação indicadora) 
agora recebe o valor —1 no lugar de 0 para as variáveis dico- 
tômicas. Nesse caso, os coeficientes representam diferenças 
de qualquer grupo em relação à média de todos os grupos, 
e não em relação ao grupo omitido. Ambas as formas de 
codificação de variáveis dicotômicas fornecerão os mesmos 
resultados; as únicas diferenças serão na interpretação dos 
coeficientes das variáveis dicotômicas. 


As variáveis dicotômicas são empregadas com mais 
frequência em análise de regressão e análise discriminan- 
te, onde os coeficientes têm interpretação direta. Seu uso 
em outras técnicas multivariadas é mais limitado, espe- 
cialmente naquelas que se sustentam em padrões de cor- 
relação, como análise fatorial, pois a correlação de uma 
variável binária não é bem representada pelo tradicional 
coeficiente de correlação de Pearson. No entanto, consi- 
derações especiais podem ser feitas nesses casos, como se 
discute nos capítulos apropriados. 


TABELA 2-13 Representação de variáveis não-métricas com variáveis dicotômicas 


Variável não-métrica com 
duas categorias (sexo) 


Variável não-métrica com três 
categorias (nível de renda familiar) 


Sexo Variáveis dicotômicas Nível de renda familiar Variáveis dicotômicas 
Feminino X=1,0uX,=0 se < $ 15.000 X=1,0uX,=0 
Masculino X=1,0UX,=0 se>$ 15.000 &< $ 25.000 X=1,0uX,=0 

se > $ 25.000 X,=1,0uX,=0 


TABELA 2-14 Padrões alternativos de codificação de variável dicotômica para uma variável não-métrica com 


três categorias 


Padrão 1 Padrão 2 Padrão 3 
Nível de renda familiar X, X, X, X, X, X, 
se < $ 15.000 1 0 1 0 0 0 
se > $ 15.000 & < $ 25.000 0 1 0 0 1 0 
se > $ 25.000 0 0 0 1 0 1 
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Resumo 


Pesquisadores devem examinar e explorar a natureza dos 
dados e as relações entre variáveis antes da aplicação de 
qualquer técnica multivariada. Este capítulo ajuda o pes- 
quisador a fazer o seguinte: 


Selecionar o método gráfico adequado para examinar as 
características dos dados ou relações de interesse. O 
uso de técnicas multivariadas coloca um fardo adicional 
sobre o pesquisador para entender, avaliar e interpretar 
os resultados mais complexos. Ele demanda uma profun- 
da compreensão das características básicas dos dados e 
relações inerentes. A primeira tarefa no exame de dados 
é determinar o caráter dos dados. Uma técnica simples, 
mas poderosa, é através de representações gráficas, que 
podem retratar as qualidades univariadas, bivariadas ou 
mesmo multivariadas dos dados em um formato visual 
para facilitar representação e análise. O ponto de partida 
para compreender a natureza de uma única variável é 
caracterizar o formato de sua distribuição, o que se con- 
segue com um histograma. O método mais popular para 
examinar relações bivariadas é o diagrama de dispersão, 
um gráfico de pontos de dados sobre duas variáveis. Pes- 
quisadores também devem examinar perfis multivaria- 
dos. Três tipos de gráficos são usados. O primeiro é um 
retrato direto dos valores dos dados, ou por glifos que 
representam os dados em círculos, ou perfis multivaria- 
dos que fornecem uma visualização por barras para cada 
observação. Um segundo tipo de retrato multivariado 
envolve uma transformação dos dados originais em uma 
relação matemática, que pode então ser retratada grafi- 
camente. A técnica mais comum deste tipo é a transfor- 
mação de Fourier. A terceira técnica gráfica é a repre- 
sentatividade iconográfica, sendo que a mais popular é a 
face de Chernoff. 


Avaliar o tipo de potencial impacto de dados perdi- 
dos. A despeito de alguns dados perdidos poderem ser 
ignorados, perda de dados ainda é um dos aspectos mais 
problemáticos na maioria dos planejamentos de pesquisa. 
Na melhor das hipóteses, ela é uma inconveniência que 
deve ser corrigida para viabilizar que a maior parte pos- 
sível da amostra seja analisada. Em situações mais com- 
plicadas, porém, a perda de dados pode provocar sérios 
vieses nos resultados se não for corretamente identifica- 
da e acomodada na análise. O processo de quatro passos 
para identificação de dados perdidos e aplicação de ações 
corretivas é como se segue: 


1. Determinar o tipo de dados perdidos, e se eles podem ou 
não ser ignorados. 

2. Determinar a extensão de perda de dados e decidir se res- 
pondentes ou variáveis devem ser eliminados. 

3. Diagnosticar a aleatoriedade dos dados perdidos. 

4. Selecionar o método de atribuição para estimação de dados 
perdidos. 


Compreender os diferentes tipos de processos de perda 
de dados. Um processo de perda de dados é a causa ine- 
rente aos dados perdidos, se é algo envolvendo o processo 
de coleta de dados (questões pobremente articuladas etc.) 
ou indivíduos (relutância ou falta de habilidade para res- 
ponder etc.). Quando dados perdidos não são ignoráveis, 
o processo de perda de dados pode ser classificado em um 
entre dois tipos. O primeiro é MCAR, que denota que 
os efeitos do processo de perda de dados estão distribuí- 
dos ao acaso nos resultados e podem ser remediados sem 
qualquer viés. O segundo é MAR, o qual denota o fato de 
que o processo inerente resulta em um viés (p. ex., taxa 
de resposta mais baixa por um certo tipo de consumidor), 
e qualquer ação corretiva deve garantir que não apenas 
“consertará” os dados perdidos, mas também não incor- 
rerá em vieses no processo. 


Explicar as vantagens e desvantagens das abordagens 
disponíveis para lidar com dados perdidos. As ações 
corretivas para dados perdidos seguem uma entre duas 
abordagens: usar apenas dados válidos, ou calcular da- 
dos de substituição para os dados perdidos. Ainda que o 
emprego de somente dados válidos pareça uma idéia ra- 
zoável, o pesquisador deve lembrar que ao fazer isso não 
se protege contra o efeito completo de vieses resultantes 
de processos não-aleatórios de dados (MAR). Logo, tais 
abordagens podem ser usadas somente quando processos 
aleatórios de dados (MCAR) estão presentes, e somente 
se a amostra não está muito esgotada para a análise em 
questão (lembre-se que dados perdidos excluem um caso 
para uso na análise). O cálculo de valores de substituição 
tenta atribuir um valor para cada caso perdido, com base 
em critérios que variam do escore médio geral da amostra 
para a variável até características específicas do caso usa- 
das em uma relação preditiva. Novamente, o pesquisador 
deve primeiramente considerar se os efeitos são MCAR 
ou MAR, e então selecionar uma ação corretiva que equi- 
libre a especificidade da ação versus a extensão dos dados 
perdidos e seu efeito sobre generalidade. 


Identificar observações atípicas univariadas, bivariadas 
e multivariadas. Observações atípicas são aquelas com 
uma combinação única de características indicando que 
elas são distintamente diferentes das demais observações. 
Essas diferenças podem ser sobre uma única variável (ob- 
servação atípica univariada), uma relação entre duas va- 
riáveis (observação atípica bivariada), ou ao longo de um 
conjunto inteiro de variáveis (caso multivariado). Apesar 
de as causas para observações atípicas serem variadas, a 
questão primária a ser resolvida é sua representatividade 
e se a observação ou variável deveria ser eliminada ou in- 
cluída na amostra a ser analisada. 


Testar seus dados para as suposições inerentes à maioria 
das técnicas multivariadas. Como nossas análise envol- 
vem o uso de uma amostra e não da população, devemos 
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nos concentrar no atendimento das suposições do pro- 
cesso de inferência estatística, o que é fundamental para 
todas as técnicas estatísticas multivariadas. As suposições 
mais importantes incluem normalidade, homocedasticida- 
de, linearidade e ausência de erros correlacionados. Uma 
vasta gama de testes, desde retratos gráficos até medidas 
empíricas, está disponível para determinar se suposições 
estão sendo atendidas. Pesquisadores se confrontam com 
aquilo que pode parecer uma tarefa impossível: satisfa- 
zer todas essas premissas estatísticas ou correr o risco de 
uma análise viesada ou errônea. Essas suposições estatís- 
ticas são importantes, mas um julgamento deve ser feito 
para saber como interpretar os testes para cada premissa 
e quando aplicar ações corretivas. Mesmo análises com 
amostras pequenas podem suportar pequenos, mas sig- 
nificantes, desvios da normalidade. O que é mais impor- 
tante para o pesquisador é compreender as implicações 
de cada suposição com relação, à técnica de interesse, 
buscando uma opção intermediaria entre a necessidade 
de satisfazer as premissas versus a robustez da técnica e 
do contexto de pesquisa. 


Determinar o melhor método de transformação de dados 
para um problema específico. Quando as suposições es- 
tatísticas não são atendidas, isso não caracteriza necessa- 
riamente um problema fatal que impede qualquer análise. 
O pesquisador pode ser capaz de aplicar qualquer número 
de transformações aos dados em questão que resolverão 
o problema e permitirão satisfazer as premissas. Trans- 
formações de dados fornecem uma maneira de modifi- 
car variáveis por uma entre duas razões: (1) para corrigir 
violações das suposições estatísticas inerentes às técnicas 
multivariadas ou (2) para melhorar a relação (correlação) 
entre variáveis. A maioria das transformações envolve a 
modificação de uma ou mais variáveis (p. ex., calcular a 
raiz quadrada, o logaritmo ou o inverso) e então usar o 
valor transformado na análise. Deve ser observado que os 
dados inerentes ainda estão intactos, sendo que somente 
seu caráter de distribuição mudou de forma a atender às 
premissas estatísticas necessárias. 


Entender como incorporar variáveis não-métricas como 
métricas. Uma consideração importante na escolha e 
aplicação da técnica multivariada correta se refere às pro- 
priedades de medida das variáveis dependentes e indepen- 
dentes. Algumas das técnicas, como análise discriminan- 
te ou análise multivariada de variância, especificamente 
exigem dados não-métricos como variáveis dependentes 
ou independentes. Em muitos casos, os métodos mul- 
tivariados exigem que variáveis métricas sejam usadas. 
No entanto, variáveis não-métricas são frequentemente 
de considerável interesse ao pesquisador em uma análise 
particular. Um método está disponível para representar 
uma variável não-métrica com um conjunto de variáveis 
dicotômicas, de modo que ele pode ser incluído em mui- 
tas das análises que demandam apenas variáveis métricas. 


Uma variável dicotômica é aquela que foi convertida para 
uma distribuição métrica e representa uma categoria de 
uma variável independente não-métrica. 

Tempo e esforço consideráveis podem ser dedicados 
nessas atividades, mas o pesquisador prudente sabiamente 
investe os recursos necessários para examinar cuidadosa- 
mente os dados para garantir que os métodos multivaria- 
dos são aplicados em situações adequadas e para auxiliar 
em uma interpretação mais profunda e esclarecedora dos 
resultados. 


Questões 


1. Explique como os métodos gráficos podem complementar 
medidas empíricas no exame de dados. 

2. Faça uma lista das causas inerentes de observações atípicas. 
Certifique-se de incluir atribuições ao respondente e ao pes- 
quisador. 

3. Discuta por que as observações atípicas podem ser classifi- 
cadas como benéficas e problemáticas. 

4. Diferencie os dados que são perdidos ao acaso (MAR) e os 
perdidos completamente ao acaso (MCAR). Explique como 
cada tipo causa impacto na análise de dados perdidos. 

5. Descreva as condições sob as quais um pesquisador elimina- 
ria um caso com dados perdidos versus as condições sob as 
quais ele usaria um método de atribuição. 

6. Avalie a seguinte afirmação: a fim de executar a maioria das 
análises multivariadas, não é necessário atender a todas as 
suposições de normalidade, linearidade, homocedasticidade 
e independência. 

7. Discuta a seguinte afirmação: A análise multivariada pode 
ser executada em qualquer conjunto de dados, desde que o 
tamanho da amostra seja adequado. 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustram as questões 
de exame de dados em aplicações específicas está disponí- 
velna Web em www.prenhall.com/hair (em inglês). 
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CAPÍTULO 


Análise Fatorial 


Objetivos de aprendizagem 


Ao concluir este capítulo, você deverá ser capaz de: 


Distinguir entre as análises fatoriais R e Q. 


Explicar o conceito de rotação de fatores. 
Descrever como nomear um fator. 


Apresentação do capítulo 


Explicar os usos adicionais de análise fatorial. 
Estabelecer as principais limitações de técnicas de análise fatorial. 


Diferenciar as técnicas de análise fatorial de outras técnicas multivariadas. 
Distinguir entre usos exploratórios e confirmatórios das técnicas analíticas fatoriais. 
Entender os sete estágios da aplicação da análise fatorial. 


Identificar as diferenças entre modelos de análise de componentes e análise de fatores comuns. 
Dizer como determinar o número de fatores a serem extraídos. 


Durante a década passada, o uso da técnica estatística multivariada de análise fatorial aumentou em 
todas as áreas de pesquisa relacionadas a negócios. À medida que o número de variáveis a serem 
consideradas em técnicas multivariadas aumenta, há uma necessidade proporcional de maior conhe- 
cimento da estrutura e das inter-relações das variáveis. Este capítulo descreve a análise fatorial, uma 
técnica particularmente adequada para analisar os padrões de relações complexas multidimensionais 
encontradas por pesquisadores. Este capítulo define e explica em termos conceituais amplos os aspec- 
tos fundamentais das técnicas analíticas fatoriais. A análise fatorial pode ser utilizada para examinar os 
padrões ou relações latentes para um grande número de variáveis e determinar se a informação pode 
ser condensada ou resumida a um conjunto menor de fatores ou componentes. Para melhor esclarecer 
os conceitos metodológicos, também foram incluídas orientações básicas para apresentar e interpretar 


os resultados dessas técnicas. 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 
pontos que merecem destaque, além das referências cruza- 
das nos termos-chave, estão em itálico. Exemplos ilustrativos 
estão em quadros. 


Alfa de Cronbach Medida de confiabilidade que varia de 0 a 1, 
sendo os valores de 0,60 a 0,70 considerados o limite inferior 
de aceitabilidade. 


Análise de agrupamentos Técnica multivariada com o objetivo 
de agrupar respondentes ou casos com perfis similares em 
um dado conjunto de características. Semelhante à análise 
fatorial Q. 

Análise de componentes Modelo fatorial no qual os fatores são 
baseados na variância total. Na análise de componentes, uni- 
dades (1s) são usadas na diagonal da matriz de correlação; 
esse procedimento implica computacionalmente que toda a 
variância é comum ou compartilhada. 

Análise de fatores comuns Modelo fatorial no qual os fatores 
são baseados em uma matriz de correlação reduzida. Ou seja, 
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comunalidades são inseridas na diagonal da matriz de corre- 
lação e os fatores extraídos são baseados apenas na variância 
comum, com as variâncias específicas e de erro excluídas. 

Análise fatorial Q Forma grupos de respondentes ou casos 
com base em sua similaridade em um conjunto de caracterís- 
ticas (ver também a discussão sobre análise de agrupamen- 
tos no Capítulo 9). 

Análise fatorial R Analisa relações entre variáveis para iden- 
tificar grupos de variáveis que formam dimensões latentes 
(fatores). 

Autovalor Soma em coluna de cargas fatoriais ao quadrado 
para um fator; também conhecido como raiz latente. Repre- 
senta a quantia de variância explicada por um fator. 

Carga cruzada Uma variável tem duas ou mais cargas fatoriais 
excedendo o valor de referência considerado necessário para 
inclusão no processo de interpretação do fator. 

Cargas fatoriais Correlação entre as variáveis originais e os fa- 
tores, bem como a chave para o entendimento da natureza 
de um fator em particular. As cargas fatoriais ao quadrado 
indicam qual percentual da variância em uma variável original 
é explicado por um fator. 

Comunalidade Quantia total de variância que uma variável ori- 
ginal compartilha com todas as outras variáveis incluídas na 
análise. 

Confiabilidade Grau em que uma variável ou conjunto de variá- 
veis é consistente com o que se pretende medir. Se múltiplas 
medidas são realizadas, as medidas confiáveis serão muito 
consistentes em seus valores. É diferente de validade, no sen- 
tido de que não se relaciona com o que deveria ser medido, 
mas com o modo como é medido. 

Definição conceitual Especificação da base teórica para um 
conceito representado por um fator. 

EQUIMAX Um dos métodos de rotação fatorial ortogonal que é 
um “meio-termo” entre as técnicas VARIMAX e QUARTIMAX, 
mas não é amplamente usado. 

Erro de medida Imprecisões ao se medirem os “verdadeiros” 
valores das variáveis, devido à falibilidade do instrumento de 
medida (ou seja, escalas de resposta inapropriadas), aos er- 
ros na entrada de dados, ou aos erros dos respondentes. 

Escalas múltiplas Método de combinação de diversas variá- 
veis que medem o mesmo conceito em uma única variável 
como tentativa de aumentar a confiabilidade da medida. Na 
maioria dos casos, as variáveis separadas são somadas e en- 
tão seu total ou escore médio é usado na análise. 

Escore fatorial Medida composta criada para cada observação 
de cada fator extraído na análise fatorial. Os pesos fatoriais 
são usados em conjunção com os valores da variável original 
para calcular o escore de cada observação. O escore fatorial 
pode então ser usado para representar o(s) fator(es) em aná- 
lises subsequentes. Os escores fatoriais são padronizados 
para que tenham uma média de O e um desvio-padrão de 1. 

Escore reverso Processo de reversão dos escores de uma va- 
riável, embora mantenha as características de distribuição, 
para mudar as relações (correlações) entre duas variáveis. 
Usado na construção de escala múltipla para evitar um can- 
celamento entre variáveis com cargas fatoriais positivas e ne- 
gativas no mesmo fator. 


Fator Combinação linear (variável estatística) das variáveis ori- 
ginais. Os fatores também representam as dimensões latentes 
(construtos) que resumem ou explicam o conjunto original de 
variáveis observadas. 

Indeterminância fatorial Característica de análise de fatores 
comuns tal que diversos escores fatoriais diferentes podem 
ser calculados para um respondente, cada um se adequando 
ao modelo fatorial estimado. Isso significa que os escores fa- 
toriais não são únicos para cada indivíduo. 

Indicador Variável simples usada em conjunção com uma ou 
mais variáveis distintas para formar uma medida composta. 

Matriz de correlação anti-imagem Matriz das correlações par- 
ciais entre variáveis após a análise fatorial, e que representa o 
grau em que os fatores explicam um ao outro nos resultados. 
A diagonal contém as medidas de adequação da amostra 
para cada variável, e os demais valores são correlações par- 
ciais entre variáveis. 

Matriz de correlação Tabela que mostra as intercorrelações en- 
tre todas as variáveis. 

Matriz de estrutura fatorial Uma matriz fatorial obtida em uma 
rotação oblíqua que representa as correlações simples entre 
variáveis e fatores, incorporando a variância Única e as cor- 
relações entre fatores. A maioria dos pesquisadores prefere 
usar a matriz de padrão fatorial no momento da interpretação 
de uma solução oblíqua. 

Matriz de padrão fatorial Uma de duas matrizes fatoriais em 
uma rotação oblíqua que é mais comparável com a matriz fa- 
torial em uma rotação ortogonal. 

Matriz fatorial Tabela das cargas fatoriais de todas as variáveis 
sobre cada fator. 

Medida composta Ver escala múltipla. 

Medida de adequação da amostra (MSA) Medida calculada 
tanto para toda a matriz de correlação quanto para cada variá- 
vel individual, e que permite avaliar o quão adequada é a apli- 
cação da análise fatorial. Valores acima de 0,50 para a matriz 
toda ou para uma variável individual indicam tal adequação. 

Multicolinearidade Grau em que uma variável pode ser expli- 
cada pelas outras variáveis na análise. 

Ortogonal Independência matemática (sem correlação) de ei- 
xos fatoriais, um em relação ao outro (ou seja, em ângulos 
retos ou de 90 graus). 

QUARTIMAX Umtipo de método de rotação fatorial ortogonal que 
foca a simplificação de colunas de uma matriz fatorial. Geral- 
mente considerada menos efetiva do que a rotação VARIMAX. 

Raiz latente Ver autovalor. 

Rotação fatorial oblíqua Rotação fatorial computada de modo 
que os fatores extraídos são correlacionados. Ao invés de res- 
tringir arbitrariamente a rotação fatorial a uma solução ortogo- 
nal, a rotação oblíqua identifica o grau em que cada fator está 
correlacionado. 

Rotação fatorial ortogonal Rotação fatorial na qual os fatores são 
extraídos de modo que seus eixos sejam mantidos em 90 graus. 
Cada fator é independente, ou ortogonal, em relação a todos os 
outros. A correlação entre os fatores é determinada como 0. 

Rotação fatorial Processo de manipulação ou de ajuste dos ei- 
xos fatoriais para conseguir uma solução fatorial mais simples 
e pragmaticamente mais significativa. 
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Teste de esfericidade de Bartlett Teste estatístico da significância 
geral de todas as correlações em uma matriz de correlação. 
Traço Representa a quantia total de variância na qual a solução 
fatorial é baseada. O traço é igual ao número de variáveis, 
baseado na suposição de que a variância em cada variável 

é igual a 1. 

Validade Grau em que uma medida ou um conjunto de medidas 
corretamente representa o conceito de estudo — o grau em 
que se está livre de qualquer erro sistemático ou não-alea- 
tório. A validade se refere a quão bem o conceito é definido 
pela(s) medida(s), ao passo que confiabilidade se refere à 
consistência da(s) medida(s). 

Validade de conteúdo Avaliação do grau de correspondência 
entre os itens selecionados para constituir uma escala múlti- 
pla e sua definição conceitual. 

Validade de expressão Ver validade de conteúdo. 

Variância comum Variância compartilhada com outras variáveis 
na análise fatorial. 

Variância do erro Variância de uma variável devido a erros na 
coleta de dados ou na medida. 

Variância específica Variância de cada variável, única àquela 
variável e que não é explicada ou associada com outras variá- 
veis na análise fatorial. 

Variância única Ver variância específica. 

Variável dicotômica Variável métrica binária usada para repre- 
sentar uma única categoria de uma variável não-métrica. 
Variável estatística Combinação linear de variáveis formada ao 
se obter pesos empíricos aplicados a um conjunto de variá- 

veis especificadas pelo pesquisador. 

Variável substituta Seleção de uma única variável com a maior 
carga fatorial para representar um fator no estágio de redução 
de dados, em vez de usar uma escala múltipla ou um escore 
fatorial. 

VARIMAX Os mais populares métodos de rotação fatorial orto- 
gonal, concentrando-se na simplificação das colunas em uma 
matriz fatorial. Geralmente considerado superior a outros mé- 
todos de rotação fatorial ortogonal para conseguir uma estru- 
tura fatorial simplificada. 


O QUE É ANÁLISE FATORIAL? 


Análise fatorial é uma técnica de interdependência, como 
definido no Capítulo 1, cujo propósito principal é definir a 
estrutura inerente entre as variáveis na análise. Obviamen- 
te, variáveis têm um papel chave em qualquer análise mul- 
tivariada. Se estivermos fazendo uma previsão de vendas 
com regressão, prevendo sucesso ou fracasso de uma nova 
empresa com análise discriminante, ou usando qualquer 
uma das demais técnicas multivariadas discutidas no Capí- 
tulo 1, devemos ter um conjunto de variáveis sobre o qual 
deve-se formar relações (p. ex., quais são as variáveis que 
melhor prevêem vendas ou sucesso/fracasso?). Como tais, 
as variáveis são os alicerces fundamentais das relações. 

À medida que empregamos técnicas multivariadas, 
por sua própria natureza, o número de variáveis aumenta. 


Técnicas univariadas são limitadas a uma única variável, 
mas técnicas multivariadas podem ter dezenas, centenas 
ou mesmo milhares de variáveis. Mas como descrevemos 
e representamos todas essas variáveis? Certamente, se 
temos apenas umas poucas variáveis, todas elas podem 
ser distintas e diferentes. À medida que acrescentamos 
mais e mais variáveis, cada vez mais a sobreposição (ou 
seja, correlação) acontece entre as mesmas. Em alguns 
casos, como aqueles nos quais estamos usando múltiplas 
medidas para superar erro de medida devido à medida 
multivariável (ver Capítulo 1 para uma discussão mais 
detalhada), o pesquisador ainda se esforça para uma cor- 
relação entre as variáveis. Quando as variáveis se tornam 
correlacionadas, o pesquisador precisa de caminhos para 
gerenciar essas variáveis — agrupando variáveis altamente 
correlacionadas, rotulando ou nomeando os grupos, e tal- 
vez até mesmo criando uma nova medida composta que 
possa representar cada grupo de variáveis. 

Introduzimos a análise fatorial como nossa primeira téc- 
nica multivariada porque ela pode desempenhar um papel 
único na aplicação de outras técnicas multivariadas. Gene- 
ricamente falando, a análise fatorial fornece as ferramentas 
para analisar a estrutura das inter-relações (correlações) 
em um grande número de variáveis (p. ex., escores de teste, 
itens de teste, respostas a questionários) definindo conjun- 
tos de variáveis que são fortemente inter-relacionadas, co- 
nhecidos como fatores. Esses grupos de variáveis (fatores), 
que são por definição altamente intercorrelacionadas, são 
considerados como representantes de dimensões dentro 
dos dados. Se estamos preocupados apenas com a redução 
do número de variáveis, então as dimensões podem orien- 
tar a criação de novas medidas compostas. Por outro lado, 
se temos uma base conceitual para compreender as rela- 
ções entre variáveis, então as dimensões podem realmente 
ter significado para aquilo que elas coletivamente represen- 
tam. No último caso, essas dimensões podem corresponder 
a conceitos que não podem ser adequadamente descritos 
por uma única medida (p. ex., a atmosfera de uma loja é 
definida por muitos componentes sensoriais que devem ser 
medidos separadamente mas são todos relacionados entre 
si). Veremos que a análise fatorial apresenta diversas ma- 
neiras de representação desses grupos de variáveis para uso 
em outras técnicas multivariadas. 

Devemos observar neste ponto que técnicas analíticas 
fatoriais podem atingir seus objetivos ou de uma perspecti- 
va exploratória, ou de uma perspectiva confirmatória. Exis- 
te um debate contínuo sobre o papel apropriado da aná- 
lise fatorial. Muitos pesquisadores consideram-na apenas 
exploratória, útil na busca da estrutura em um conjunto de 
variáveis ou como um método de redução de dados. Sob 
essa perspectiva, as técnicas analíticas fatoriais “conside- 
ram o que os dados oferecem” e não estabelecem restrições 
a priori sobre a estimação de componentes nem sobre o nú- 
mero de componentes a serem extraídos. Para muitas — tal- 
vez a maioria — das aplicações, esse uso da análise fatorial é 
adequado. No entanto, em outras situações, o pesquisador 
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tem idéias preconcebidas sobre a real estrutura dos dados, 
baseado em suporte teórico ou em pesquisas anteriores. 
Ele pode desejar testar hipóteses envolvendo questões so- 
bre, por exemplo, quais variáveis deveriam ser agrupadas 
em um fator, ou o número exato de fatores. Nesses casos, O 
pesquisador espera que a análise fatorial desempenhe um 
papel confirmatório — ou seja, avalie o grau em que os da- 
dos satisfazem a estrutura esperada. Os métodos que discu- 
timos neste capítulo não fornecem diretamente a estrutura 
necessária para testes de hipóteses formalizadas. Aborda- 
mos explicitamente a perspectiva confirmatória da análise 
fatorial no Capítulo 11. Neste capítulo, porém, vemos as 
técnicas analíticas fatoriais principalmente de um ponto de 
vista exploratório ou não-confirmatório. 


UM EXEMPLO HIPOTÉTICO 
DE ANALISE FATORIAL 


Considere que, durante uma pesquisa qualitativa, uma 
empresa de varejo tenha identificado 80 características 
diferentes de lojas de varejo e seus serviços que, segundo 
os consumidores, afetaram sua preferência entre lojas. O 
varejista quer entender como os consumidores tomam de- 
cisões, mas sente que não pode avaliar 80 características 
separadas ou desenvolver planos de ação para todas essas 
variáveis, pois elas são específicas demais. Em vez disso, 
o varejista gostaria de saber se os consumidores pensam 
em dimensões de avaliação mais gerais, ao invés de itens 
específicos. Por exemplo, consumidores podem conside- 
rar vendedores como uma dimensão avaliativa mais geral 
que é composta de muitas outras características específi- 
cas, como conhecimento, cortesia, empatia, sensibilidade, 
simpatia, prontidão e assim por diante. 

Para identificar essas dimensões mais amplas, o vare- 
jista poderia encomendar uma pesquisa que sondasse as 
avaliações dos consumidores sobre cada um dos 80 itens 
específicos. A análise fatorial seria então usada para iden- 
tificar as dimensões de avaliação latentes. Itens específi- 
cos altamente correlacionados são considerados um ele- 
mento daquela dimensão mais ampla. Essas dimensões se 
tornam composições de variáveis específicas, as quais, por 
sua vez, permitem que as dimensões sejam interpretadas 
e descritas. Em nosso exemplo, a análise fatorial poderia 
identificar dimensões, como diversidade de produtos, qua- 
lidade de produtos, preços, profissionais da loja, serviço e 
atmosfera da loja como as dimensões de avaliação usadas 
pelos respondentes. Cada uma dessas dimensões contém 
itens específicos que são uma faceta da dimensão avalia- 
tiva mais ampla. A partir dessas descobertas, o varejista 
pode então usar as dimensões (fatores) para definir áreas 
amplas de planejamento e ação. 

Este exemplo simples de análise fatorial demonstra 
seu objetivo básico de agrupar variáveis altamente cor- 
relacionadas em conjuntos distintos (fatores). Em mui- 
tas situações, esses fatores podem fornecer uma grande 


Um exemplo ilustrativo de uma aplicação simples da 
análise fatorial é mostrado na Figura 3-1, a qual repre- 
senta a matriz de correlação para nove elementos da 
imagem de uma loja. Incluídos nesse conjunto estão me- 
didas da oferta de produtos, pessoal, níveis de preço, e 
serviços e experiências internos. A questão que um pes- 
quisador pode querer levantar é: aqueles elementos to- 
dos são separados no que se refere às suas propriedades 
de avaliação, ou eles se “agrupam” em algumas áreas 
mais gerais de avaliação? Por exemplo, será que todos 
os elementos dos produtos se agrupam? Onde o nível de 
preço se encaixa ou está separado? Como as característi- 
cas internas (p.ex., pessoal, serviço e atmosfera) se rela- 
cionam umas com as outras? A inspeção visual da matriz 
de correlação original (Figura 3-1, parte 1) não revela 
facilmente qualquer padrão específico. Há correlações 
elevadas espalhadas, mas os agrupamentos de variáveis 
não são óbvios. A aplicação da análise fatorial resulta 
no agrupamento de variáveis, como se reflete na parte 
2 da Figura 3-1. Aqui alguns padrões interessantes apa- 
recem. Primeiro, quatro variáveis relacionadas com ex- 
periências internas de clientes são colocadas juntas. Em 
seguida, três variáveis que descrevem a diversidade e a 
disponibilidade de produtos são agrupadas. Finalmente, 
a qualidade de produto e os níveis de preço formam ou- 
tro grupo. Cada grupo representa um conjunto de variá- 
veis altamente inter-relacionadas que pode refletir uma 
dimensão avaliativa mais geral. Nesse caso, poderíamos 
rotular os três agrupamentos de variáveis pelos nomes 
experiência interna, oferta de produtos e valor. 


quantidade de informação sobre as inter-relações das 
variáveis. Neste exemplo, a análise fatorial identificou 
para gerenciamento de loja um conjunto menor de con- 
ceitos para se considerar em qualquer plano de marke- 
ting estratégico ou tático, enquanto ainda fornece uma 
visão sobre o que constitui cada área geral (i.e., as variá- 
veis individuais definindo cada fator). 


PROCESSO DE DECISÃO EM 
ANALISE FATORIAL 


Centralizamos a discussão de análise fatorial sobre o para- 
digma da construção de modelo em seis estágios introdu- 
zido no Capítulo 1. A Figura 3-2 mostra os três primeiros 
estágios do tratamento estruturado para construção de 
modelo multivariado, e a Figura 3-4 detalha os três está- 
gios finais, acrescidos de um estágio adicional (estágio 7), 
além da estimação, interpretação e validação dos mode- 
los fatoriais, que ajuda a selecionar variáveis substitutas, 
computar escores fatoriais ou criar escalas múltiplas para 
uso em outras técnicas multivariadas. Uma discussão de 
cada estágio vem a seguir. 
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PARTE 1: MATRIZ ORIGINAL DE CORRELAÇÃO 


V, V, V, V, V, A V, V, A 
V, Nível de preço 1,000 
V, Pessoal da loja 0,427 1,000 
V, Política de devolução 0,302 0,771 1,000 
V, Disponibilidade do produto 0,470 0,497 0,427 1,000 
V, Qualidade do produto 0,765 0,406 0,307 0,427 1,000 
V. Profundidade de diversidade 0,281 0,445 0,423 0,713 0,325 1,000 
Y, Amplidão da diversidade 0,345 0,490 0,471 0,719 0,378 0,724 1,000 
V, Serviço interno 0,242 0,719 0,733 0,428 0,240 0,311 0,435 1,000 
V, Atmosfera da loja 0,372 0,737 0,774 0,479 0,326 0,429 0,466 0,710 1,000 


PARTE 2: MATRIZ DE CORRELAÇÃO DE VARIÁVEIS APÓS AGRUPAMENTO DE ACORDO COM ANÁLISE FATORIAL 


V, VA A V, V, V, A V, A 
V, Política de retorno 1,000 
V, Serviço interno 0,773 1,000 
V, Atmosfera da loja 0,771 0,710 1,000 
V, Pessoal da loja 0,771 0,719 0,737 1,000 
Vo Profundidade de diversidade 0,423 0,311 0,429 0,445 1,000 
V, Amplidão de diversidade 0,471 0,435 0,466 0,490 0,724 1,000 
V, Disponibilidade do produto 0,427 0,428 0,479 0,497 0,713 0,729 1,000 
V, Nível de preço 0,302 0,242 0,372 0,427 0,281 0,354 0,470 1,000 
V; Qualidade do produto 0,307 0,240 0,326 0,406 0,325 0,378 0,427 0,765 1,000 


Nota: Áreas sombreadas representam variáveis agrupadas por análise fatorial. 
FIGURA 3-1 


Estágio 1: Objetivos da análise fatorial 


O ponto de partida em análise fatorial, bem como em 
outras técnicas estatísticas, é o problema de pesquisa. O 
propósito geral de técnicas de análise fatorial é encontrar 
um modo de condensar (resumir) a informação contida 
em diversas variáveis originais em um conjunto menor de 
novas dimensões compostas ou variáveis estatísticas (fa- 
tores) com uma perda mínima de informação — ou seja, 
buscar e definir os construtos fundamentais ou dimensões 
assumidas como inerentes às variáveis originais [18,33]. 
Ao atingir seus objetivos, a análise fatorial é ajustada com 
quatro questões: especificação da unidade de análise; ob- 
tenção do resumo de dados e/ou redução dos mesmos; se- 
leção de variáveis e uso de resultados da análise fatorial 
com outras técnicas multivariadas. 


Especificação da unidade de análise 

Até agora, definimos análise fatorial somente em termos da 
identificação de estrutura em um conjunto de variáveis. Aná- 
lise fatorial é, na verdade, um modelo mais geral, no sentido 
de que ela pode identificar a estrutura de relações entre va- 
riáveis ou respondentes pelo exame ou de correlações entre 
as variáveis, ou de correlações entre os respondentes. 


Exemplo ilustrativo do uso de análise fatorial para identificar estrutura dentro de um grupo de variáveis. 


e Se o objetivo da pesquisa fosse resumir as características, 
a análise fatorial seria aplicada a uma matriz de correlação 
das variáveis. Esse é o tipo mais comum de análise fatorial 
e é chamado de análise fatorial R, que analisa um conjunto 
de variáveis para identificar as dimensões latentes (que não 
são fáceis de observar). 

e A análise fatorial também pode ser aplicada a uma matriz 
de correlação dos respondentes individuais baseada nas 
características dos mesmos. Chamado de análise fatorial 
Q, este método combina ou condensa grandes números de 
pessoas em diferentes grupos de uma população maior. A 
análise fatorial OQ não é utilizada muito frequentemente 
por causa das dificuldades computacionais. Em vez disso, a 
maioria dos pesquisadores utiliza algum tipo de análise de 
agrupamentos (ver Capítulo 9) para agrupar respondentes 
individuais. Ver também Stewart [36] para outras possíveis 
combinações de grupos e tipos de variáveis. 


Assim, o pesquisador deve primeiramente selecionar 
a unidade de análise para a análise fatorial: variáveis ou 
respondentes. Ainda que nos concentremos prioritaria- 
mente na estruturação de variáveis, a opção de empregar 
análise fatorial entre respondentes como uma alternativa 
para a análise de agrupamentos também está disponível. 
As implicações em termos da identificação de variáveis ou 
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Estágio 1 


Selecione objetivo(s): 


Redução de dados 


I 
Confirmatória 


Modelagem de equações estruturais 


Problema de pesquisa 
A análise é exploratória ou confirmatória? 


Resumo de dados e identificação de estruturas 


(Capítulos 10 e 11) 


Exploratória 


Estágio 2 


Selecione o tipo de análise fatorial 


O que está sendo agrupado — variáveis ou casos? 


Casos 
Análise fatorial do tipo Q ou 
análise de agrupamentos (Capítulo 8) 


Variáveis 
Análise fatorial do tipo R 


Delineamento da pesquisa 


Quais variáveis são incluídas? 
Como as variáveis são medidas? 
Qual é o tamanho de amostra 
desejado? 


Estágio 3 


Suposições 


Considerações estatísticas de 
normalidade, linearidade e 
homoscedasticidade 
Homogeneidade da amostra 
Conexões conceituais 


Para o 
estágio 
4 


FIGURA 3-2 Estágios 1-3 no diagrama de decisão da análise fatorial. 


respondentes similares serão discutidas no estágio 2 quan- 
do a matriz de correlação for definida. 


Obtenção do resumo versus redução de dados 

A análise fatorial fornece ao pesquisador duas saídas 
distintas mas relacionadas: resumo de dados e redução 
de dados. No resumo de dados, a análise fatorial obtém 


dimensões inerentes que, quando interpretadas e com- 
preendidas, descrevem os dados em um número muito 
menor de conceitos do que as variáveis individuais origi- 
nais. Redução de dados estende esse processo derivando 
um valor empírico (escore fatorial) para cada dimensão 
(fator) e então substituindo o valor original por esse 
novo valor. 
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Resumo de dados. O conceito fundamental envolvido 
no resumo de dados é a definição de estrutura. Através 
da estrutura, o pesquisador pode ver o conjunto de variá- 
veis em diversos níveis de generalização, variando do ní- 
vel mais detalhado (as próprias variáveis individuais) até 
o nível mais generalizado, onde variáveis individuais são 
agrupadas e então vistas não por aquilo que elas repre- 
sentam individualmente, mas por aquilo que representam 
coletivamente na expressão de um conceito. 


Por exemplo, variáveis no nível individual poderiam ser: 
“Compro coisas especiais”, “Geralmente procuro os me- 
nores preços possíveis”, “Compro produtos em promo- 
ções”, “Marcas nacionais valem mais a pena do que mar- 
cas próprias”. Coletivamente essas variáveis poderiam ser 
usadas para identificar consumidores que são “conscientes 
sobre preços” ou “caçadores de promoções”. 


A análise fatorial, enquanto técnica de interdepen- 
dência, difere das técnicas de dependência discutidas na 
próxima seção (i.e., regressão múltipla, análise discrimi- 
nante, análise multivariada de variância ou análise con- 
junta) onde uma ou mais variáveis são explicitamente 
consideradas o critério ou variáveis dependentes, e todas 
as outras são as variáveis preditoras ou independentes. 
Na análise fatorial, todas as variáveis são simultanea- 
mente consideradas sem distinção quanto ao seu caráter 
de dependência ou independência. A análise fatorial ain- 
da emprega o conceito de variável estatística, a composi- 
ção linear de variáveis, mas em análise fatorial as variá- 
veis estatísticas (fatores) são formadas para maximizar 
sua explicação do conjunto inteiro de variáveis, e não 
para prever uma ou mais variáveis dependentes. A meta 
do resumo de dados é atingida definindo-se um pequeno 
número de fatores que adequadamente representam o 
conjunto original de variáveis. 

Se fizéssemos uma analogia com técnicas de dependên- 
cia, seria no sentido de que cada uma das variáveis obser- 
vadas (originais) é uma variável dependente, que é uma 
função de alguns conjuntos inerentes e latentes de fatores 
(dimensões), que são por sua vez compostos por todas as 
outras variáveis. Assim, cada variável é prevista por todos 
os fatores e, indiretamente, por todas as demais variáveis. 
Reciprocamente, pode-se olhar cada fator (variável esta- 
tística) como uma variável dependente, que é uma função 
do conjunto inteiro de variáveis observadas. Qualquer 
analogia ilustra as diferenças de meta entre técnicas de 
dependência (previsão) e interdependência (identificação 
de estrutura). Estrutura se define pelas relações entre va- 
riáveis, viabilizando a especificação de um número menor 
de dimensões (fatores) representando o conjunto original 
de variáveis. 


Redução de dados. A análise fatorial também pode ser 
usada para conseguir redução de dados pela (1) identi- 


ficação de variáveis representativas a partir de um con- 
junto muito maior de variáveis para uso em análises 
multivariadas subsegiientes, ou (2) pela criação de um 
conjunto inteiramente novo de variáveis, muito menor, 
para substituir parcial ou completamente o conjunto 
original de variáveis. Em ambos os casos, o propósito é 
manter a natureza e o caráter das variáveis originais, mas 
reduzir seu número para simplificar a análise multivaria- 
da a ser empregada a seguir. Ainda que as técnicas multi- 
variadas tenham sido desenvolvidas para acomodar múl- 
tiplas variáveis, o pesquisador está sempre procurando 
o conjunto mais parcimonioso de variáveis para incluir 
na análise. Como discutido no Capítulo 1, tanto questões 
conceituais quanto empíricas apóiam a criação de medi- 
das compostas. A análise fatorial fornece a base empírica 
para avaliar a estrutura de variáveis e o potencial para 
criar essas medidas compostas ou selecionar um subcon- 
junto de variáveis representativas para análise posterior. 

O resumo de dados faz da identificação das dimensões 
ou fatores latentes um fim em si próprio. Assim, as esti- 
mativas dos fatores e as contribuições de cada variável 
aos fatores (chamadas de cargas) são tudo o que requer a 
análise. A redução de dados também depende de cargas 
fatoriais, mas elas são usadas como a base para identificar 
variáveis para análises posteriores com outras técnicas ou 
para fazer estimativas dos próprios fatores (escores fa- 
toriais ou escalas múltiplas), as quais substituem as va- 
riáveis originais em análises subsegientes. O método de 
calcular e interpretar cargas fatoriais será apresentado 
posteriormente. 


Seleção de variáveis 

Seja a análise fatorial usada para redução e/ou resumo 
de dados, o pesquisador deve sempre considerar as bases 
conceituais das variáveis e julgar quanto à adequação das 
variáveis para a análise fatorial. 


e Em ambos os usos da análise fatorial, o pesquisador impli- 
citamente especifica as dimensões potenciais que podem ser 
identificadas por meio do caráter e da natureza das variá- 
veis submetidas à análise fatorial. Por exemplo, ao avaliar 
as dimensões de imagem da loja, se nenhuma questão sobre 
pessoal da loja for incluída, a análise fatorial não será capaz 
de identificar tal dimensão. 

e O pesquisador deve também lembrar que análise fatorial 
sempre produzirá fatores. Assim, a análise fatorial é sem- 
pre um candidato potencial para o fenômeno “lixo dentro, 
lixo fora”. Se o pesquisador incluir indiscriminadamente um 
grande número de variáveis e esperar que a análise fatorial 
“arrume as coisas”, então torna-se elevada a possibilidade 
de resultados pobres. A qualidade e o significado dos fato- 
res obtidos reflete as bases conceituais das variáveis incluí- 
das na análise. 


Obviamente, o emprego da análise fatorial como uma 
técnica de resumo de dados baseia-se em ter uma base 
conceitual para qualquer variável analisada. Mas ainda 
que a análise fatorial seja usada apenas para fins de re- 
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dução de dados, ela é mais eficiente quando dimensões 
conceitualmente definidas podem ser representadas pelos 
fatores obtidos. 


Uso de análise fatorial com outras 

técnicas multivariadas 

A análise fatorial, por fornecer uma visão muito direta 
das inter-relações entre variáveis e a estrutura subjacente 
dos dados, é um excelente ponto de partida para muitas 
outras técnicas multivariadas. Da perspectiva do resumo 
de dados, a análise fatorial fornece ao pesquisador uma 
clara compreensão sobre quais variáveis podem atuar jun- 
tas e quantas variáveis podem realmente ser consideradas 
como tendo impacto na análise. 


e Variáveis determinadas como altamente correlacionadas e 
membros do mesmo fator devem ter perfis semelhantes de 
diferenças ao longo de grupos em análise multivariada de 
variância ou em análise discriminante. 

e Variáveis altamente correlacionadas, como aquelas dentro 
de um fator, afetam os procedimentos por etapas de regres- 
são múltipla e análise discriminante que sequencialmente 
incluem variáveis com base em seu poder preditivo incre- 
mental sobre variáveis já presentes no modelo. Quando se 
inclui uma variável de um fator, torna-se menos provável 
que variáveis adicionais do mesmo fator sejam também in- 
cluídas, devido a suas elevadas correlações com variáveis 
já presentes no modelo, o que significa que elas têm pouco 
poder preditivo a ser acrescentado. Isso não significa que 
as outras variáveis do fator são menos importantes ou têm 
menor impacto, mas que seus efeitos já estão representados 
pela variável incluída do fator. Assim, o conhecimento em 
si da estrutura das variáveis daria ao pesquisador uma me- 
lhor compreensão da razão por trás da entrada de variáveis 
nesta técnica. 


A visão dada pelo resumo de dados pode ser direta- 
mente incorporada em outras técnicas multivariadas por 
meio de qualquer técnica de redução de dados. A análise 
fatorial fornece a base para a criação de um novo con- 
junto de variáveis que incorporam o caráter e a natureza 
das variáveis originais em um número muito menor de 
novas variáveis, usando variáveis representativas, escores 
fatoriais ou escalas múltiplas. Dessa maneira, problemas 
associados com grandes números de variáveis ou altas 
intercorrelações entre variáveis podem ser substancial- 
mente reduzidos pela substituição das novas variáveis. O 
pesquisador pode se beneficiar com a estimação empírica 
de relações, bem como com a visão do fundamento con- 
ceitual e da interpretação dos resultados. 


Estágio 2: Planejamento de uma análise fatorial 


O planejamento de uma análise fatorial envolve três deci- 
sões básicas: (1) cálculo dos dados de entrada (uma matriz 
de correlação) para atender os objetivos especificados de 
agrupamento de variáveis ou respondentes; (2) planeja- 
mento do estudo em termos de número de variáveis, pro- 


priedades de medida das variáveis e tipos de variáveis ad- 
missíveis; e (3) o tamanho necessário para a amostra em 
termos absolutos e como função do número de variáveis 
na análise. 


Correlações entre variáveis ou respondentes 

A primeira decisão no planejamento de uma análise fa- 
torial focaliza o cálculo dos dados de entrada para a aná- 
lise. Discutimos anteriormente as duas formas de análise 
fatorial: análise fatorial do tipo R versus tipo O. Ambos 
os tipos utilizam uma matriz de correlação como os da- 
dos de entrada básicos. Com a análise fatorial do tipo R, 
o pesquisador usaria uma matriz tradicional de correla- 
ção (correlações entre variáveis) como entrada. Mas o 
pesquisador poderia também escolher a opção de obter 
a matriz de correlação a partir das correlações entre os 
respondentes individuais. Nessa análise fatorial de tipo O, 
os resultados seriam uma matriz fatorial que identificaria 
indivíduos semelhantes. 


Por exemplo, se os respondentes individuais são identi- 
ficados por números, o padrão fatorial resultante pode 
nos dizer que os indivíduos 1, 5, 6 e 7 são semelhantes. 
Do mesmo modo, os respondentes 2, 3, 4 e 8 talvez ocu- 
passem juntos um outro fator, e então os rotularíamos 
como semelhantes. 


Dos resultados de uma análise fatorial O, poderíamos 
identificar grupos ou agrupamentos de indivíduos que de- 
monstrassem um padrão parecido nas variáveis incluídas 
na análise. 

Uma questão lógica neste ponto seria: de que forma 
a análise fatorial do tipo OQ difere da análise de agrupa- 
mentos, uma vez que ambas comparam o padrão de res- 
postas ao longo de várias variáveis e estabelecem os res- 
pondentes em grupos? A resposta é que a análise fatorial 
OQ é baseada nas intercorrelações entre os respondentes, 
enquanto a análise de agrupamentos forma grupos com 
base em uma medida de similaridade dada em termos de 
distância entre os escores dos respondentes para as variá- 
veis que são analisadas. 


Para ilustrar essa diferença, considere a Figura 3-3, que 
contém os escores de quatro respondentes para três va- 
riáveis diferentes. Uma análise fatorial do tipo O desses 
quatro respondentes produziria dois grupos com estru- 
turas de covariância semelhantes, que consistiria nos 
respondentes A e €C versus B e D. Em contrapartida, 
a análise de agrupamentos seria sensível às distâncias 
reais entre os escores dos respondentes e conduziria a 
um agrupamento dos pares mais próximos. Logo, com 
uma análise de agrupamentos, os respondentes A e B 
seriam colocados em um grupo, e Ce D, em outro. 
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FIGURA 3-3 Comparações de perfis de escore para análise fatorial do tipo Q e análise de agrupamentos. 


Se o pesquisador decidir empregar análise fatorial do 
tipo Q, essas diferenças em relação às técnicas tradicio- 
nais de análise de agrupamentos deverão ser notadas. 
Com a disponibilidade de outras técnicas de agrupamento 
e o amplo uso de análise fatorial para redução e resumo 
de dados, o restante da discussão neste capítulo focaliza 
a análise fatorial do tipo R, o agrupamento de variáveis e 
não de respondentes. 


Questões sobre seleção de variáveis e medidas 

Duas questões específicas devem ser respondidas nes- 
te ponto: (1) quais tipos de variáveis podem ser usadas 
em análise fatorial? e (2) quantas variáveis devem ser 
incluídas? Em termos dos tipos de variáveis incluídas, o 
requisito principal é que um valor de correlação possa 
ser calculado entre todas as variáveis. Variáveis métricas 
são facilmente medidas por vários tipos de correlações. 
Variáveis não-métricas, contudo, são mais problemáti- 
cas por não poderem usar os mesmos tipos de medida de 
correlação empregados em variáveis métricas. Apesar de 
alguns métodos especializados calcularem correlações en- 
tre variáveis não-métricas, a abordagem mais prudente é 
evitá-las. Se uma variável não-métrica deve ser incluída, 
um método é definir variáveis dicotômicas (codificadas 
como ( e 1) para representarem categorias de variáveis 
não-métricas. Se todas as variáveis são dicotômicas, então 
formas especializadas de análise fatorial, como análise fa- 
torial booleana, são mais adequadas [5]. 

O pesquisador também deve tentar minimizar o núme- 
ro de variáveis incluídas, mas manter um número razoável 
de variáveis por fator. Se um estudo está sendo planejado 
para avaliar uma estrutura proposta, o pesquisador deve 
certificar-se de incluir diversas variáveis (cinco ou mais) 
que possam representar cada fator proposto. A força da 
análise fatorial reside em encontrar padrões entre grupos 
de variáveis, e é de pouco uso na identificação de fatores 
compostos por uma única variável. Finalmente, quando se 
planeja um estudo para ser analisado por fatores, o pes- 
quisador deve, se possível, identificar diversas variáveis- 


chave (algumas vezes chamadas de indicadores-chave ou 
variáveis de marcação) que intimamente reflitam os fa- 
tores latentes que foram previstos hipoteticamente. Isso 
ajudará na validação dos fatores determinados e na ava- 
liação da significância prática dos resultados. 


Tamanho da amostra 

No que se refere à questão do tamanho da amostra, o pes- 
quisador dificilmente realiza uma análise fatorial com uma 
amostra com menos de 50 observações, e de preferência o 
tamanho da amostra deve ser maior ou igual a 100. Como 
regra geral, o mínimo é ter pelo menos cinco vezes mais 
observações do que o número de variáveis a serem ana- 
lisadas, e o tamanho mais aceitável teria uma proporção 
de dez para um. Alguns pesquisadores chegam a propor 
um mínimo de 20 casos para cada variável. Deve-se lem- 
brar, contudo, que com 30 variáveis, por exemplo, há 435 
correlações a serem calculadas na análise fatorial. Em um 
nível de significância de 0,05, talvez até mesmo 20 dessas 
correlações fossem consideradas significantes e apareces- 
sem na análise fatorial somente por sorte. O pesquisador 
sempre deve tentar obter a maior proporção de casos-por- 
variável para minimizar as chances de superajustar os da- 
dos (ou seja, determinar fatores específicos da amostra, 
com pouca generalidade). O pesquisador pode fazer isso 
empregando o conjunto de variáveis mais parcimonioso, 
guiado por considerações conceituais e práticas, e então 
obtendo um tamanho adequado da amostra para o núme- 
ro de variáveis examinadas. Quando se lida com amostras 
menores e/ou com uma proporção menor de casos-por- 
variáveis, o pesquisador sempre deve interpretar qual- 
quer descoberta com precaução. A questão do tamanho 
da amostra também será abordada em uma seção adiante 
ao se interpretarem cargas fatoriais. 


Resumo 

Questões no planejamento de uma análise fatorial são 
de importância igualmente crítica se uma perspectiva 
exploratória ou confirmatória é assumida. Sob qualquer 
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ponto de vista, o pesquisador está confiando na técnica 
para fornecer uma visão sobre a estrutura dos dados, mas 
a estrutura revelada na análise depende de decisões do 
pesquisador em áreas como variáveis incluídas, tamanho 
da amostra e assim por diante. Desse modo, diversas con- 
siderações-chave são listadas nas Regras Práticas 3-1. 


Estágio 3: Suposições na análise fatorial 


As suposições críticas na análise fatorial são mais concei- 
tuais do que estatísticas. O pesquisador está sempre preo- 
cupado em atender a exigência estatística para qualquer 
técnica multivariada, mas em análise fatorial as preocu- 
pações que se impõem se centram muito mais no caráter 
e na composição das variáveis incluídas na análise do que 
em suas qualidades estatísticas. 


Questões conceituais 

As premissas conceituais subjacentes à análise fatorial se 
referem ao conjunto de variáveis selecionadas e à amostra 
escolhida. Uma suposição básica da análise fatorial é que 
existe alguma estrutura subjacente no conjunto de variá- 
veis escolhidas. A presença de variáveis correlacionadas 
e a subsegiiente definição de fatores não garantem rele- 
vância, mesmo que elas satisfaçam as exigências estatís- 
ticas. É responsabilidade do pesquisador garantir que os 
padrões observados sejam conceitualmente válidos e ade- 
quados para se estudar com análise fatorial, pois a técnica 
não dispõe de meios para determinar adequação além das 
correlações entre variáveis. Por exemplo, misturar variá- 
veis dependentes e independentes em uma análise fatorial 
e então usar os fatores obtidos para apoiar relações de de- 
pendência é inadequado. 


REGRAS PRÁTICAS 3-1 


Planejamento de análise fatorial 


Análise fatorial é executada geralmente apenas sobre 

variáveis métricas, apesar de existirem métodos 

especializados para o emprego de variáveis dicotômicas; 

um número pequeno de “variáveis dicotômicas” pode 

ser incluído em um conjunto de variáveis métricas que 

são analisadas por fatores. 

Se um estudo está sendo planejado para revelar 

estrutura fatorial, esforce-se para ter pelo menos cinco 

variáveis para cada fator proposto. 

Para tamanho de amostra: 

e A amostra deve ter mais observações do que 
variáveis. 

e O menor tamanho absoluto de amostra deve ser de 
50 observações. 

Maximize o número de observações por variável, com 

um mínimo de 5 e, com sorte, com pelo menos 10 

observações por variável. 


O pesquisador deve também garantir que a amostra 
é homogênea com relação à estrutura fatorial inerente. 
É inadequado aplicar análise fatorial em uma amostra 
de homens e mulheres para um conjunto de itens conhe- 
cidos por diferirem por conta de sexo. Quando as duas 
subamostras (homens e mulheres) são combinadas, as 
correlações resultantes e a estrutura de fatores serão uma 
representação pobre da estrutura exclusiva de cada gru- 
po. Logo, sempre que grupos diferentes são esperados na 
amostra, análises fatoriais separadas devem ser executa- 
das, e os resultados devem ser comparados para identi- 
ficar diferenças não refletidas nos resultados da amostra 
combinada. 


Questões estatísticas 

De um ponto de vista estatístico, os desvios da normali- 
dade, da homocedasticidade e da linearidade aplicam-se 
apenas porque eles diminuem as correlações observadas. 
Apenas a normalidade é necessária se um teste estatístico 
é aplicado para a significância dos fatores, mas esses testes 
raramente são usados. Na verdade, um pouco de multico- 
linearidade é desejável, pois o objetivo é identificar con- 
juntos de variáveis inter-relacionadas. 

Assumindo que o pesquisador atende as exigências 
conceituais para as variáveis incluídas na análise, o próxi- 
mo passo é garantir que as variáveis são suficientemente 
correlacionadas umas com as outras para produzir fato- 
res representativos. Como veremos, podemos avaliar esse 
grau de relacionamento a partir de pontos de vista geral 
ou individual. A seguir há diversas medidas empíricas 
para ajudar no diagnóstico da fatorabilidade da matriz de 
correlação. 


Medidas gerais de intercorrelação. Além das bases esta- 
tísticas para as correlações da matriz de dados, o pesqui- 
sador também deve garantir que a matriz de dados tenha 
correlações suficientes para justificar a aplicação da análi- 
se fatorial. Se se descobrir que todas as correlações são pe- 
quenas, ou que todas as correlações são iguais (mostrando 
que não existe qualquer estrutura para agrupar variáveis), 
então o pesquisador deve questionar a aplicação de análi- 
se fatorial. Para esse propósito, diversas abordagens estão 
disponíveis: 


e Se a inspeção visual não revela um número substancial de 
correlações maiores que 0,30, então a análise fatorial pro- 
vavelmente é inapropriada. As correlações entre variáveis 
também podem ser analisadas computando-se as correlações 
parciais entre variáveis. Uma correlação parcial é aquela que 
não é explicada quando os efeitos de outras variáveis são le- 
vados em consideração. Se existem fatores “verdadeiros” nos 
dados, a correlação parcial deverá ser pequena, pois a variá- 
vel pode ser explicada pelas variáveis que compõem os fato- 
res. Se as correlações parciais são altas, indicando ausência 
de fatores inerentes, então a análise fatorial é inadequada. O 
pesquisador está procurando um padrão de altas correlações 
parciais, denotando uma variável não correlacionada com 
um grande número de outras variáveis na análise. 
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A única exceção referente a elevadas correlações como 
indicativas de uma matriz de correlação pobre acontece 
quando duas variáveis estão altamente correlacionadas e 
têm cargas substancialmente maiores do que outras variá- 
veis naquele fator. Logo, a correlação parcial delas pode ser 
elevada porque elas não são explicadas em grande parte pe- 
las outras variáveis, mas explicam umas a outras. Essa exce- 
ção espera-se também quando um fator tem somente duas 
variáveis com cargas elevadas. 

Uma elevada correlação parcial é aquela com significân- 
cia prática e estatística, e uma regra prática seria considerar 
correlações parciais acima de 0,7 como elevadas. O SPSS e 
o SAS fornecem a matriz de correlação anti-imagem, que 
é simplesmente o valor negativo da correlação parcial, en- 
quanto o BMDP nos dá as correlações parciais diretamente. 
Em cada caso, as correlações parciais ou correlações antii- 
magem maiores são indicativas de uma matriz de dados que 
talvez não seja adequada para análise fatorial. 

e Outro modo de determinar a adequação da análise fatorial 
examina a matriz de correlação inteira. O teste de esfericidade 
de Bartlett, um teste estatístico para a presença de correlações 
entre as variáveis, é uma medida dessa natureza. Ele fornece 
a significância estatística de que a matriz de correlação tem 
correlações significantes entre pelo menos algumas das variá- 
veis. O pesquisador deve perceber, porém, que aumentar o 
tamanho da amostra faz com que o teste Bartlett se torne mais 
sensível na detecção de correlações entre as variáveis. 

e Uma terceira medida para quantificar o grau de intercorre- 
lações entre as variáveis e a adequação da análise fatorial é a 
medida de adequação da amostra (MSA). Esse índice varia 
de O a 1, alcançando 1 quando cada variável é perfeitamen- 
te prevista sem erro pelas outras variáveis. A medida pode 
ser interpretada com as seguintes orientações: 0,80 ou acima, 
admirável; 0,70 ou acima, mediano; 0,60 ou acima, medíocre; 
0,50 ou acima, ruim; e abaixo de 0,50, inaceitável [22,23]*. O 
MSA aumenta quando (1) o tamanho da amostra aumenta, 
(2) as correlações médias aumentam, (3) o número de va- 
riáveis aumenta, ou (4) o número de fatores diminui [23]. O 
pesquisador sempre deve ter um valor MSA geral acima de 
0,50 antes de proceder com a análise fatorial. Se o valor MSA 
ficar abaixo de 0,50, então os valores específicos MSA (ver a 
discussão que se segue) podem identificar variáveis para eli- 
minação para atingir um valor geral de 0,50. 


Medidas específicas de intercorrelação de variáveis. 
Além de um exame visual das correlações de uma variá- 
vel com outras na análise, as orientações MSA podem ser 
estendidas para variáveis individuais. O pesquisador deve 
examinar os valores MSA para cada variável e excluir 
aquelas que estão no domínio inaceitável. No processo 
de eliminação de variáveis, o pesquisador deve primeiro 
eliminar a variável com o menor MSA e então recalcular 
a análise fatorial. Continue esse processo de eliminar a va- 
riável com o menor valor MSA abaixo de 0,50 até que to- 
das as variáveis tenham um valor aceitável. Uma vez que 
variáveis individuais atinjam um nível aceitável, então o 


*N.de R.T.: A frase correta seria “0,80 ou acima, admirável; maior 
ou igual a 0,70 e abaixo de 0,80, mediano; maior ou igual a 0,60 e 
abaixo de 0,70, medíocre; maior ou igual a 0,50 e abaixo de 0,60, 
ruim; e abaixo de 0,50, inaceitável”. 


MSA geral pode ser calculado e uma decisão pode ser to- 
mada sobre a continuidade da análise fatorial. 


Resumo 

A análise fatorial, enquanto técnica de interdependência, 
é de várias formas mais afetada se não atender suas pre- 
missas conceituais inerentes do que pelas suposições esta- 
tísticas. O pesquisador deve se certificar de compreender 
completamente as implicações não apenas de garantir que 
os dados atendem as exigências estatísticas para uma esti- 
mação apropriada da estrutura fatorial, mas de que o con- 
junto de variáveis tem a fundamentação conceitual para 
embasar os resultados. Fazendo isso, o pesquisador deve 
considerar várias orientações importantes, como listadas 
nas Regras Práticas 3-2. 


Estágio 4: Determinação de fatores 
e avaliação do ajuste geral 


Uma vez que as variáveis sejam especificadas e a matriz 
de correlação seja preparada, o pesquisador está pronto 
para aplicar a análise fatorial para identificar a estrutura 
latente de relações (ver Figura 3-4). Nisso, as decisões de- 
vem ser tomadas com relação (1) ao método de extração 
dos fatores (análise de fatores comuns versus análise de 
componentes) e (2) ao número de fatores selecionados 
para explicar a estrutura latente dos dados. 


Seleção do método de extração de fatores 

O pesquisador pode escolher a partir de dois métodos se- 
melhantes, ainda que únicos, para definir (extrair) os fato- 
res que representem a estrutura das variáveis na análise. 
Essa decisão sobre o método a ser usado deve combinar 
os objetivos da análise fatorial com o conhecimento sobre 
algumas características básicas das relações entre variá- 
veis. Antes de discutirmos sobre os dois métodos dispo- 
níveis para extração de fatores, apresentamos uma breve 
introdução à partição da variância de uma variável. 


REGRAS PRÁTICAS 3-2 


Teste das suposições da análise fatorial 


Uma forte fundamentação conceitual é necessária para 
embasar a suposição de que existe uma estrutura antes 
que a análise fatorial seja realizada. 

Um teste de esfericidade de Bartlett estatisticamente 
significante (sign. < 0,05) indica que correlações 
suficientes existem entre as variáveis para se continuar a 
análise. 

Medidas de valores de adequação da amostra (MSA) 
devem exceder 0,50 tanto para o teste geral quanto 
para cada variável individual; variáveis com valores 
inferiores a 0,50 devem ser omitidas da análise fatorial 
uma por vez, sendo aquela com menor valor eliminada 
a cada vez. 
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FIGURA 3-4 Estágios 4-7 no diagrama de decisão da análise fatorial. 
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Partição da variância de uma variável. Para escolher entre 
os dois métodos de extração de fatores, o pesquisador deve 
primeiro ter certa compreensão da variância para uma va- 
riável e como ela é dividida ou particionada. Primeiro, lem- 
bre que variância é um valor (i.e., o quadrado do desvio pa- 
drão) que representa a quantia total de dispersão de valores 
para uma única variável em torno de sua média. Quando 
uma variável é correlacionada com outra, dizemos muitas 
vezes que ela compartilha variância com a outra variável, e 
essa quantia de partilha entre apenas duas variáveis é sim- 
plesmente a correlação ao quadrado. Por exemplo, se duas 
variáveis têm uma correlação de 0,50, cada variável com- 
partilha 25% (0,50”) de sua variância com a outra. 

Em análise fatorial, agrupamos variáveis por suas cor- 
relações, de modo que variáveis em um grupo (fator) têm 
elevadas correlações umas com as outras. Assim, para os 
propósitos da análise fatorial, é importante entender o 
quanto da variância de uma variável é compartilhado com 
outras variáveis naquele fator versus o que não pode ser 
compartilhado (p.ex., inexplicado). A variância total de 
qualquer variável pode ser dividida (particionada) em três 
tipos de variância: 


1. Variância comum é definida como aquela variância em uma 
variável que é compartilhada com todas as outras variáveis 
na análise. Essa variância é explicada (compartilhada) com 
base nas correlações de uma variável com as demais na aná- 
lise. A comunalidade de uma variável é a estimativa de sua 
variância compartilhada, ou em comum, entre as variáveis 
como representadas pelos fatores obtidos. 

2. Variância específica (também conhecida como variância 
única) é aquela associada com apenas uma variável específi- 
ca. Essa variância não pode ser explicada pelas correlações 
com as outras variáveis, mas ainda é associada unicamente 
com uma variável. 

3. Variância de erro é também variância que não pode ser ex- 
plicada por correlações com outras variáveis, mas resulta da 
não confiabilidade no processo de coleta de dados, de erro de 
medida ou de componente aleatório no fenômeno medido. 


Assim, a variância total de uma variável é composta de 
suas variâncias comum, única e de erro. Quando uma va- 
riável é mais correlacionada com uma ou mais variáveis, 
a variância comum (comunalidade) aumenta. Por outro 
lado, se medidas não-confiáveis ou outras fontes de va- 
riância de erros externos são introduzidas, então a quan- 
tia de variância comum possível é reduzida, bem como a 
habilidade de relacionar a variável com qualquer outra. 


Análise de fatores comuns versus análise de compo-nen- 
tes. Com uma compreensão básica sobre como a variân- 
cia pode ser particionada, o pesquisador está pronto para 
abordar as diferenças entre os dois métodos, conhecidos 
como análise de fatores comuns e análise de componen- 
tes. A escolha de um método em vez do outro é baseada 
em dois critérios: (1) os objetivos da análise fatorial e (2) 
o montante de conhecimento prévio sobre a variância nas 
variáveis. A análise de componentes é usada quando o 


objetivo é resumir a maior parte da informação original 
(variância) a um número mínimo de fatores para fins de 
previsão. Em contraste, análise de fatores comuns é usada 
prioritariamente para identificar fatores ou dimensões la- 
tentes que refletem o que as variáveis têm em comum. A 
comparação mais direta entre os dois métodos é pelo seu 
uso da variância explicada versus não-explicada: 


e Análise de componente, também conhecida como análise de 
componentes principais, considera a variância total e deriva 
fatores que contêm pequenas proporções de variância única 
e, em alguns casos, variância de erro. Não obstante, os pri- 
meiro poucos fatores não contêm variância de erro ou única 
o suficiente para distorcer a estrutura fatorial geral. Especi- 
ficamente, com análise de componentes, unidades (valores 
de 1,0) são inseridas na diagonal da matriz de correlação, de 
modo que a variância completa é trazida à matriz fatorial. 
A Figura 3-5 retrata o emprego da variância total em análi- 
se de componentes e as diferenças quando comparada com 
análise de fatores comuns. 

e Análise de fator comum, em contraste, considera apenas va- 
riância em comum ou compartilhada, assumindo que tanto a 
variância de erro quanto a única não são de interesse na de- 
finição da estrutura das variáveis. Para empregar apenas va- 
riância comum na estimação dos fatores, comunalidades (ao 
invés de unidades) são inseridas na diagonal. Assim, fatores 
resultantes da análise de fator comum se baseiam somente 
na variância comum. Como mostrado na Figura 3-5, a análi- 
se de fator comum exclui uma porção da variância incluída 
em uma análise de componentes. 


Como o pesquisador escolherá entre os dois métodos? 
Primeiro, tanto o modelo de fator comum quanto o de análi- 
se de componente são amplamente usados. Em termos prá- 
ticos, o modelo por componentes é o método padrão típico 
da maioria dos programas estatísticos, quando se executa 
uma análise fatorial. Além do padrão em programas, casos 
distintos indicam qual dos dois métodos é o mais adequado: 


A análise fatorial de componentes é a mais adequada quando: 


e redução de dados é uma preocupação prioritária, focando 
o número mínimo de fatores necessários para explicar a 
porção máxima da variância total representada no conjunto 
original de variáveis, e 

e conhecimento anterior sugere que variância específica e de 
erro representam uma proporção relativamente pequena da 
variância total. 


Análise de fatores comuns é mais apropriada quando: 


e oobjetivo prioritário é identificar as dimensões ou construtos 
latentes representados nas variáveis originais, e 

e o pesquisador tem pouco conhecimento sobre a quantia de 
variância específica e de erro, e, portanto, deseja eliminar 
essa variância. 


A análise de fatores comuns, com suas suposições mais 
restritivas e uso apenas de dimensões latentes (variância 
compartilhada), muitas vezes é vista como algo teoricamen- 
te mais fundamentado. No entanto, apesar de teoricamente 
válida, ela tem vários problemas. Primeiro, a análise de fa- 
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FIGURA 3-5 Tipos de variância considerados na matriz fatorial. 


tores comuns sofre de indeterminância fatorial, o que sig- 
nifica que para qualquer respondente individual, diversos 
escores fatoriais diferentes podem ser calculados a partir 
dos resultados de um único modelo fatorial [26]. Não há so- 
lução única, como ocorre em análise de componentes, mas 
na maioria dos casos as diferenças não são substanciais. A 
segunda questão envolve o cálculo de comunalidades esti- 
madas usadas para representar a variância compartilhada. 
Às vezes as comunalidades não são estimáveis ou podem 
ser inválidas (p.ex., valores maiores que 1 ou menores que 
0), exigindo a eliminação da variável da análise. 

A escolha de um modelo ou de outro realmente afe- 
ta os resultados? As complicações da análise de fatores 
comuns têm contribuído para o amplo uso de análise de 
componentes. Mas a base de proponentes para o modelo 
de fator comum é forte. Cliff [13] caracteriza a disputa en- 
tre os dois lados como se segue: 


Algumas autoridades insistem que análise de com- 
ponentes é a única abordagem adequada, e que os 
métodos de fatores comuns apenas impõem termino- 
logia confusa, lidando com coisas fundamentalmente 
não-mensuráveis, os fatores comuns. Os sentimen- 
tos são, em certo sentido, ainda mais fortes no outro 
lado. Partidários da análise de fatores comuns insis- 
tem que a análise de componentes é, na melhor das 
hipóteses, uma análise de fatores comuns com algum 
erro acrescentado, e, na pior das hipóteses, uma mis- 
tura confusa e inaceitável de coisas a partir das quais 
nada pode ser determinado. Alguns chegam a insis- 
tir que o termo “análise fatorial” não deve ser usado 
quando a análise de componentes é executada. 


Apesar de ainda haver muito debate sobre qual mode- 
lo fatorial é o mais apropriado [6, 19, 25, 35], a pesquisa 
empírica tem demonstrado resultados análogos em mui- 
tos casos [37]. Na maioria das aplicações, tanto a análise de 
componentes quanto a análise de fatores comuns chegam 
a resultados essencialmente idênticos se o número de va- 
riáveis exceder 30 [18], ou se as comunalidades excederem 
0,60 para a maioria das variáveis. Se o pesquisador estiver 
preocupado com as suposições da análise de componen- 
tes, então a análise de fatores comuns também deve ser 
aplicada para avaliar sua representação da estrutura. 


Quando uma decisão foi tomada no modelo fatorial, 
o pesquisador está pronto para extrair os fatores iniciais 
não-rotacionados. Examinando a matriz fatorial não-rota- 
cionada, ele pode explorar as possibilidades de redução de 
dados e obter uma estimativa preliminar do número de fa- 
tores a extrair. A determinação final do número de fatores, 
porém, deve esperar até o momento em que os resultados 
sejam rotacionados e os fatores sejam interpretados. 


Critérios para o número de fatores a extrair 
Como decidimos sobre o número de fatores a serem ex- 
traídos? Ambos os métodos de análise fatorial estão in- 
teressados na melhor combinação linear de variáveis 
— melhor no sentido de que a combinação particular de 
variáveis originais explica a maior parte da variância nos 
dados como um todo comparada a qualquer outra combi- 
nação linear de variáveis. Logo, o primeiro fator pode ser 
visto como o melhor resumo de relações lineares exibidas 
nos dados. O segundo fator é definido como a segunda 
melhor combinação linear das variáveis, sujeita à restri- 
ção de que é ortogonal ao primeiro fator. Para ser orto- 
gonal ao primeiro fator, o segundo fator deve ser obtido 
da variância remanescente depois que o primeiro fator foi 
extraído. Assim, o segundo fator pode ser definido como a 
combinação linear de variáveis que explica a maior parte 
da variância que ainda é inexplicada após o efeito da re- 
moção do primeiro fator dos dados. O processo continua 
extraindo fatores que explicam quantias cada vez menores 
de variância até que toda a variância seja explicada. Por 
exemplo, o método de componentes realmente extrai n 
fatores, onde n é o número de variáveis na análise. Assim, 
se 30 variáveis estão na análise, 30 fatores são extraídos. 
Assim, o que se ganha com análise fatorial? Apesar 
de nosso exemplo conter 30 fatores, alguns dos primeiros 
fatores podem explicar uma porção substancial da variân- 
cia total ao longo de todas as variáveis. Espera-se que o 
pesquisador possa reter ou usar apenas um pequeno nú- 
mero de variáveis* e ainda representar adequadamente o 
conjunto inteiro de variáveis. Assim, a questão-chave é: 
quantos fatores devem ser extraídos ou retidos? 


*N.deR.T.: A palavra correta seria “fatores”. 
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Ao decidir quando parar a fatoração (i.e., quantos 
fatores devem ser extraídos), o pesquisador deve combi- 
nar uma fundamentação conceitual (quantos fatores de- 
vem estar na estrutura?) com alguma evidência empírica 
(quantos fatores podem ser razoavelmente sustentados”). 
O pesquisador geralmente começa com alguns critérios 
pré-determinados, como o número geral de fatores mais 
algumas referências gerais de relevância prática (p.ex., 
percentual exigido de variância explicada). Esses critérios 
são combinados com medidas empíricas da estrutura fato- 
rial. Uma base quantitativa exata para decidir o número 
de fatores a extrair ainda não foi desenvolvida. No entan- 
to, os seguintes critérios de parada têm sido utilizados. 


Critério da raiz latente. A técnica mais comumente usa- 
da é o critério da raiz latente. Esta técnica é simples de 
aplicar na análise de componentes, bem como na análise 
de fatores comuns. O raciocínio para o critério da raiz 
latente é que qualquer fator individual deve explicar a va- 
riância de pelo menos uma variável se o mesmo há de ser 
mantido para interpretação. Com a análise de componen- 
tes, cada variável contribui com um valor 1 do autovalor 
total. Logo, apenas os fatores que têm raízes latentes ou 
autovalores maiores que 1 são considerados significan- 
tes; todos os fatores com raízes latentes menores que 1 
são considerados insignificantes e são descartados. Usar 
o autovalor para estabelecer um corte é mais confiável 
quando o número de variáveis está entre 20 e 50. Se o nú- 
mero de variáveis é menor que 20, há uma tendência para 
que esse método extraia um número conservador (muito 
pouco) de fatores; ao passo que, quando mais de 50 va- 
riáveis estão envolvidas, não é raro que muitos fatores 
sejam extraídos. 


Critério a priori. O critério a priori é um critério sim- 
ples, ainda que razoável sob certas circunstâncias. Quando 
aplicado, o pesquisador já sabe quantos fatores extrair an- 
tes de empreender a análise fatorial. O pesquisador sim- 
plesmente instrui o computador a parar a análise quando 
o número desejado de fatores tiver sido extraído. Este 
tratamento é útil quando se testa uma teoria ou hipóte- 
se sobre o número de fatores a serem extraídos. Também 
pode ser justificado na tentativa de repetir o trabalho de 
outro pesquisador e extrair o mesmo número de fatores 
anteriormente encontrado. 


Critério de percentagem de variância O critério de 
percentagem de variância é uma abordagem baseada na 
conquista de um percentual cumulativo especificado da 
variância total extraída por fatores sucessivos. O objetivo 
é garantir significância prática para os fatores determina- 
dos, garantindo que expliquem pelo menos um montan- 
te especificado de variância. Nenhuma base absoluta foi 
adotada para todas as aplicações. No entanto, em ciên- 
cias naturais, o procedimento de obtenção de fatores ge- 
ralmente não deveria ser parado até os fatores extraídos 


explicarem pelo menos 95% da variância, ou até o último 
fator explicar apenas uma pequena parcela (menos que 
5%). Em contraste, em ciências sociais, nas quais as infor- 
mações geralmente são menos precisas, não é raro consi- 
derar uma solução que explique 60% da variância total (e 
em alguns casos até menos) como satisfatória. 

Uma variante deste critério envolve a seleção de fato- 
res suficientes para atingir uma comunalidade pré-espe- 
cificada para cada variável. Se razões teóricas ou práticas 
requerem uma certa comunalidade para cada variável, en- 
tão o pesquisador incluirá tantos fatores quanto necessá- 
rios para representar adequadamente cada uma das variá- 
veis originais. Isso difere de focalizar somente o montante 
total de variância explicada, o que negligencia o grau de 
explicação para as variáveis individuais. 


Critério do teste scree. Lembre que, no modelo fatorial 
de análise de componentes, os últimos fatores extraídos 
contêm tanto a variância comum quanto a única. Apesar 
de todos os fatores conterem pelo menos alguma variância 
única, a proporção de variância única é substancialmente 
maior nos últimos fatores. O teste scree é usado para iden- 
tificar o número ótimo de fatores que podem ser extraídos 
antes que a quantia de variância única comece a dominar 
a estrutura de variância comum [9]. 

O teste scree é determinado fazendo-se o gráfico das 
raízes latentes em relação ao número de fatores em sua 
ordem de extração, e a forma da curva resultante é usa- 
da para avaliar o ponto de corte. A Figura 3-6 exibe os 
primeiros 18 fatores extraídos em um estudo. Começan- 
do com o primeiro fator, os ângulos de inclinação rapida- 
mente decrescem no início e então lentamente se aproxi- 
mam de uma reta horizontal. O ponto no qual o gráfico 
começa a ficar horizontal é considerado indicativo do nú- 
mero máximo de fatores a serem extraídos. No presente 
caso, os primeiros 10 fatores se qualificariam. Além de 10, 
uma grande proporção de variância única seria incluída; 
logo, esses fatores não seriam aceitáveis. Observe que, ao 
se usar o critério da raiz latente, apenas 8 fatores teriam 
sido considerados. Entretanto, usar o teste scree nos dá 2 
fatores a mais. Como regra geral, o teste scree resulta em 
pelo menos um e às vezes dois ou três fatores a mais sendo 
considerados para inclusão em relação ao critério da raiz 
latente [9]. 


Heterogeneidade dos respondentes. A variância com- 
partilhada entre variáveis é a base para ambos os modelos 
fatoriais, de fator comum e de componentes. Uma supo- 
sição inerente é que a variância compartilhada se estende 
ao longo de toda a amostra. Se esta é heterogênea em re- 
lação a pelo menos um subconjunto das variáveis, então 
os primeiros fatores representam aquelas variáveis mais 
homogêneas em toda a amostra. As variáveis que são 
melhores discriminadoras entre os subgrupos da amostra 
carregam nos últimos fatores, muitas vezes aqueles não- 
selecionados pelos critérios recém discutidos [17]. Quan- 
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FIGURA 3-6 Gráfico de autovalor para o critério de teste scree. 


do o objetivo é identificar fatores que discriminam entre 
os subgrupos de uma amostra, o pesquisador deve extrair 
fatores adicionais, além dos indicados pelos métodos cita- 
dos, e examinar a habilidade dos fatores adicionais de dis- 
criminar os grupos. Se eles demonstrarem serem menos 
benéficos na discriminação, a solução poderá ser proces- 
sada novamente e esses últimos fatores, eliminados. 


Resumo dos critérios de seleção de fatores. Na práti- 
ca, a maioria dos pesquisadores raramente usa um único 
critério para determinar quantos fatores devem ser ex- 
traídos. Inicialmente eles usam um critério como o da 
raiz latente como uma orientação para a primeira ten- 
tativa de interpretação. Depois que os fatores foram in- 
terpretados, como discutido nas seções seguintes, a sua 
praticabilidade é avaliada. Os fatores identificados por 
outros critérios também são interpretados. A seleção do 
número de fatores é inter-relacionada com uma avalia- 
ção da estrutura, a qual é revelada na fase de interpre- 
tação. Assim, diversas soluções fatoriais com diferentes 
números de fatores são examinadas antes que a estrutura 
seja bem definida. Ao tomar a decisão final sobre a solu- 
ção fatorial para representar a estrutura das variáveis, o 
pesquisador deve lembrar as considerações listadas nas 
Regras Práticas 3-3. 

Uma advertência quanto à seleção do conjunto final 
de fatores: há consequências negativas na seleção de fato- 
res em excesso ou a menos para representar os dados. Se 
pouquíssimos fatores são selecionados, a estrutura correta 
não é revelada e dimensões importantes podem ser omi- 
tidas. Se muitos fatores são mantidos, a interpretação se 
torna mais difícil quando os resultados são rotacionados 
(como discutido na próxima seção). Apesar de os fatores 
serem independentes, você pode ter fatores a mais ou a 
menos, sem dificuldades. Por analogia, escolher o número 


REGRAS PRÁTICAS 3-3 


Escolha de modelos fatoriais e 
número de fatores 


e Apesar de os modelos de análise de fatores comuns 
e de análise de componentes levarem a resultados 
similares em ambientes comuns de pesquisa (30 
variáveis ou mais, ou comunalidades de 0,60 para a 
maioria das variáveis): 

e O modelo de análise de componentes é mais 
adequado quando a redução de dados é soberana 


e O modelo de fatores comuns é melhor em aplicações 
teóricas bem especificadas 


Qualquer decisão sobre o número de fatores a serem 
mantidos deve se basear em diversas considerações: 


e Uso de diversos critérios de parada para determinar 
o número inicial de fatores a serem mantidos: 


Fatores com autovalores maiores do que 1,0 
Um número pré-determinado de fatores baseado 
em objetivos da pesquisa e/ou pesquisa anterior 


Fatores suficientes para atender um percentual 
especificado de variância explicada, geralmente 
60% ou mais 


Fatores apontados pelo teste scree como tendo 
quantias substanciais de variância comum (i.e., 
fatores antes do ponto de inflexão) 


Mais fatores quando heterogeneidade está 
presente entre subgrupos da amostra 


Consideração de várias soluções alternativas (um 
fator a mais e um a menos em relação à solução 
inicial) para garantir que a melhor estrutura seja 
identificada 
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de fatores é algo como focar um microscópio. Ajuste mui- 
to alto ou muito baixo irá obscurecer uma estrutura que 
é óbvia quando o ajuste está simplesmente correto. Logo, 
pelo exame de uma certa quantia de diferentes estruturas 
fatoriais obtidas a partir de várias tentativas de soluções, 
o pesquisador pode comparar e contrastar para chegar à 
melhor representação dos dados. 

Assim como outros aspectos de modelos multivariados, 
a parcimônia é importante. A exceção notável é quando 
a análise fatorial é usada exclusivamente para redução de 
dados e um nível estabelecido de variância a ser extraído 
é especificado. O pesquisador sempre deve se empenhar 
em ter o conjunto de fatores mais representativo e parci- 
monioso possível. 


Estágio 5: Interpretação dos fatores 


Apesar de não existirem processos ou orientações ine- 
quívocas para determinar a interpretação de fatores, o 
pesquisador com forte fundamentação conceitual para 
a estrutura antecipada e sua justificativa tem a maior 
chance de sucesso. Não podemos estabelecer de manei- 
ra suficientemente impactante a importância de uma 
forte fundamentação conceitual, seja ela vinda de pes- 
quisa anterior, paradigmas teóricos ou princípios comu- 
mente aceitos. Como veremos, o pesquisador deve re- 
petidamente fazer julgamentos subjetivos em decisões, 
como o número de fatores, quais são as relações sufi- 
cientes para garantir variáveis que discriminam grupos, 
e como podem ser identificados esses grupos. Como 
pode atestar o pesquisador experiente, praticamente 
qualquer coisa pode ser descoberta se houver empenho 
suficientemente insistente (p.ex., usando diferentes mo- 
delos fatoriais, extraindo diferentes números de fatores, 
usando várias formas de rotação). Portanto, deixa-se 
para o pesquisador o papel de juiz de última instância 
quanto à forma e à adequação de uma solução fatorial, 
e tais decisões são melhor guiadas por bases conceituais 
do que por bases empíricas. 

Para auxiliar no processo de interpretação de uma es- 
trutura fatorial e escolher a solução final, três processos 
fundamentais são descritos. Dentro de cada processo, di- 
versas questões importantes (rotação fatorial, significân- 
cia de carga fatorial e interpretação) são encontradas. As- 
sim, após a breve descrição de cada processo, os mesmos 
serão discutidos mais detalhadamente. 


Os três processos de interpretação fatorial 

A interpretação fatorial é circular por natureza. O pes- 
quisador primeiramente avalia os resultados iniciais, em 
seguida faz alguns julgamentos vendo e refinando tais 
resultados, com a evidente possibilidade de que a aná- 
lise seja reespecificada, exigindo-se uma volta ao passo 
avaliativo. Assim, o pesquisador não deve se surpreen- 
der se executar diversas iterações até que uma solução 
final seja obtida. 


Estimativa da matriz fatorial. Primeiro, a matriz fatorial 
inicial não-rotacionada é computada, contendo as cargas 
fatoriais para cada variável sobre cada fator. Cargas fato- 
riais são a correlação de cada variável com o fator. Cargas 
indicam o grau de correspondência entre a variável e o 
fator, com cargas maiores tornando a variável representa- 
tiva do fator. Cargas fatoriais são o meio de interpretar o 
papel que cada variável tem na definição de cada fator. 


Rotação de fatores. Soluções fatoriais não-rotacionadas 
atingem a meta de redução de dados, mas o pesquisador 
deve perguntar se a solução fatorial não-rotacionada (que 
preenche as exigências matemáticas desejáveis) fornecerá 
informação que oferece interpretação a mais adequada 
das variáveis sob exame. Na maioria dos casos, a respos- 
ta a essa questão é negativa, pois rotação fatorial (uma 
discussão mais detalhada segue na próxima seção) deve 
simplificar a estrutura fatorial. Portanto, o pesquisador 
a seguir emprega um método rotacional para conseguir 
soluções mais simples e teoricamente mais significativas. 
Na maioria das vezes, a rotação de fatores melhora a in- 
terpretação pela redução de algumas das ambigiiidades 
que frequentemente acompanham as soluções fatoriais 
não-rotacionadas. 


Interpretação e reespecificação de fatores. Como um 
processo final, o pesquisador avalia as cargas fatoriais (ro- 
tacionadas) para cada variável a fim de determinar o papel 
da mesma e sua contribuição na determinação da estrutura 
fatorial. No curso deste processo de avaliação, pode surgir 
a necessidade de reespecificar o modelo fatorial devido (1) 
à eliminação de uma variável(is) da análise, (2) ao desejo 
de empregar um método rotacional diferente para inter- 
pretação, (3) à necessidade de extrair um número diferen- 
te de fatores, ou (4) ao desejo de mudar de um método de 
extração para outro. A reespecificação de um modelo fato- 
rial é realizada retornando-se ao estágio de extração (está- 
gio 4), extraindo fatores e interpretando-os novamente. 


Rotação de fatores 

Talvez a ferramenta mais importante na interpretação de 
fatores seja a rotação fatorial. O termo rotação significa 
exatamente o que sugere. Especificamente, os eixos de re- 
ferência dos fatores são rotacionados em torno da origem 
até que alguma outra posição seja alcançada. Como ante- 
riormente indicado, as soluções de fatores não-rotaciona- 
dos extraem fatores na ordem de sua variância extraída. 
O primeiro fator tende a ser um fator geral com quase 
toda variável com carga significante, e explica a quantia 
maior de variância. O segundo fator e os seguintes são en- 
tão baseados na quantia residual de variância. Cada fator 
explica porções sucessivamente menores de variância. O 
efeito final de rotacionar a matriz fatorial é redistribuir 
a variância dos primeiros fatores para os últimos com o 
objetivo de atingir um padrão fatorial mais simples e teo- 
ricamente mais significativo. 
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O caso mais simples de rotação é uma rotação orto- 
gonal, na qual os eixos são mantidos a 90 graus. Também 
é possível rotacionar os eixos sem manter o ângulo de 90 
graus entre os eixos de referência. Quando não há a restri- 
ção de ser ortogonal, o procedimento de rotação se chama 
rotação oblíqua. Rotações fatoriais ortogonais e oblíquas 
são demonstradas nas Figuras 3-7 e 3-8, respectivamente. 


A Figura 3-7, na qual cinco variáveis são retratadas 
em um diagrama fatorial bidimensional, ilustra a rota- 
ção fatorial. O eixo vertical representa o fator II não- 
rotacionado, e o horizontal corresponde ao fator I não- 
rotacionado. Os eixos são rotulados com 0 na origem e 
prolongados para +1,0 ou —1,0. Os números nos eixos 
representam as cargas fatoriais. As cinco variáveis são 
rotuladas por V,, V,, V,, V,e Vs. A carga fatorial para a 
variável 2 (V,) no fator II não-rotacionado é determina- 
da desenhando-se uma linha tracejada horizontalmente 
a partir do ponto do dado até o eixo vertical do fator II. 
De modo similar, uma linha vertical é tracejada a partir 
da variável 2 até o eixo horizontal do fator não-rotacio- 
nado 1 para determinar a carga da variável 2 no fator 
I. Um procedimento semelhante adotado para as outras 
variáveis determina as cargas fatoriais para as soluções 
não-rotacionadas e rotacionadas, como exibido na Tabe- 
la 3-1 para fins de comparação. No primeiro fator não- 
rotacionado, todas as variáveis têm carga alta. No segun- 
do, as variáveis 1 e 2 são muito altas na direção positiva. 
A variável 5 é moderadamente alta na direção negativa, 
e as variáveis 3 e 4 têm cargas consideravelmente meno- 
res na direção negativa. 

A partir da inspeção visual da Figura 3-7, é óbvio que 
há dois agrupamentos de variáveis. As variáveis 1 e 2 es- 
tão juntas, assim como as variáveis 3, 4 e 5. No entanto, 
tal padrão de variáveis não é tão óbvio a partir das cargas 
fatoriais não-rotacionadas. Rotacionando os eixos ori- 
ginais no sentido horário, como indicado na Figura 3-7, 
obtemos um padrão de cargas fatoriais completamente 
diferente. Observe que, rotacionando os fatores, os eixos 
são mantidos a 90 graus. Esse procedimento significa que 
os fatores são matematicamente independentes e que a 
rotação foi ortogonal. Após rotacionar os eixos fatoriais, 
as variáveis 3, 4 e 5 têm cargas altas no fator I, e as variá- 
veis 1 e 2 têm cargas elevadas no fator II. Logo, o agrupa- 
mento ou padrão dessas variáveis em dois grupos é mais 
óbvio após a rotação, ainda que a posição ou configura- 
ção relativa das variáveis permaneça a mesma. 


Os mesmos princípios gerais de rotações ortogonais 
são aplicáveis a rotações oblíquas. No entanto, o método 
de rotação oblíqua é mais flexível, pois os eixos fatoriais 
não precisam ser ortogonais. Além disso, é mais realista, 
porque as dimensões inerentes que são teoricamente im- 
portantes não são supostas sem correlações entre si. Na 
Figura 3-8, os dois métodos rotacionais são comparados. 


Note que a rotação fatorial oblíqua representa o agrupa- 
mento de variáveis com maior precisão. Essa precisão é 
um resultado do fato de que cada eixo fatorial rotacionado 
agora está mais próximo do respectivo grupo de variáveis. 
Além disso, a solução oblíqua fornece informações sobre 
o grau em que os fatores realmente estão correlacionados 
um com o outro. 

Muitos pesquisadores concordam que a maioria das so- 
luções diretas não-rotacionadas não é suficiente. Ou seja, 
na maioria dos casos, a rotação melhora a interpretação 
reduzindo algumas das ambigiiidades que frequentemen- 
te acompanham a análise preliminar. A principal opção 
disponível é escolher um método de rotação ortogonal ou 
oblíqua. A meta final de qualquer rotação é obter alguns 
fatores teoricamente significativos e, se possível, a estru- 
tura fatorial mais simples. As rotações ortogonais são 
mais amplamente usadas porque todos os pacotes com- 
putacionais com análise fatorial contêm opções de rota- 
ção ortogonal, enquanto os métodos oblíquos não são tão 
difundidos. As rotações ortogonais também são utilizadas 
mais frequentemente porque os procedimentos analíticos 
para rotações oblíquas não são tão bem desenvolvidos e 
ainda estão sujeitos a considerável controvérsia. Várias 
abordagens diferentes estão à disposição para a execução 
de rotações ortogonais ou oblíquas. Contudo, apenas um 
número limitado de procedimentos de rotação oblíqua 
está disponível na maioria dos pacotes estatísticos. Logo, 
o pesquisador provavelmente deverá aceitar o que lhe é 
fornecido. 


Métodos rotacionais ortogonais. Na prática, o objetivo 
de todos os métodos de rotação é simplificar as linhas e 
colunas da matriz fatorial para facilitar a interpretação. 
Em uma matriz fatorial, as colunas representam fatores, e 
cada linha corresponde às cargas de uma variável ao longo 
dos fatores. Por simplificação das linhas, queremos dizer 
tornar o máximo de valores em cada linha tão próximos 
de zero quanto possível (isto é, maximizar a carga de uma 
variável em um único fator). Simplificação das colunas 
significa tornar o máximo de valores em cada coluna tão 
próximos de zero quanto possível (ou seja, tornar o núme- 
ro de cargas “elevadas” o menor possível). Três aborda- 
gens ortogonais principais foram desenvolvidas: 


1. A meta final de uma rotação QUARTIMAX é simplificar 
as linhas de uma matriz fatorial; ou seja, QUARTIMAX se 
concentra em rotacionar o fator inicial de modo que uma 
variável tenha carga alta em um fator e cargas tão baixas 
quanto possível em todos os outros fatores. Nessas rotações, 
muitas variáveis podem ter carga alta no mesmo fator, pois 
a técnica se concentra em simplificar as linhas. O método 
QUARTIMAX não tem se mostrado bem-sucedido na 
produção de estruturas mais simples. Sua dificuldade é que 
ele tende a produzir um fator geral como o primeiro fator, 
no qual a maioria das variáveis, se não todas, tem cargas 
altas. Independentemente de qualquer conceito do que é 
uma estrutura “mais simples”, ela inevitavelmente envolve 
lidar com agrupamentos de variáveis; um método que tende 
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FIGURA 3-7 Rotação fatorial ortogonal. 


a criar um grande fator geral (isto é, QUARTIMAX) não 
está de acordo com os propósitos de rotação. 

Diferentemente de QUARTIMAX, o critério VARIMAX 
se concentra na simplificação das colunas da matriz fatorial. 
Com a abordagem rotacional VARIMAX, a simplificação 
máxima possível é conseguida se houver apenas Is e Os em 
uma coluna. Ou seja, o método VARIMAX maximiza a soma 
de variâncias de cargas exigidas da matriz fatorial. Lembre-se 
que, nas abordagens QUARTIMAX, muitas variáveis podem 
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ter cargas altas ou próximas de altas no mesmo fator, pois a 
técnica se concentra em simplificar as linhas. Com a aborda- 
gem rotacional VARIMAX, há uma tendência para algumas 
cargas altas (isto é, próximas de —1 ou +1) e algumas cargas 
próximas de O em cada coluna da matriz. A lógica é que a in- 
terpretação é mais fácil quando as correlações variável-fator 
são (1) próximas de +1 ou —1, indicando assim uma clara as- 
sociação positiva ou negativa entre a variável e o fator; ou (2) 
próximas de 0, apontando para uma clara falta de associa- 
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FIGURA 3-8 Rotação fatorial oblíqua. 
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TABELA 3-1 Comparação entre cargas fatoriais rotacionadas e não-rotacionadas 


Cargas fatoriais Cargas fatoriais 


não-rotacionadas rotacionadas 
Variáveis | H | H 
V, 0,50 0,80 0,03 0,94 
V, 0,60 0,70 0,16 0,90 
Vs 0,90 —0,25 0,95 0,24 
V, 0,80 —0,30 0,84 0,15 
Vs 0,60 —0,50 0,76 -0,13 


ção. Essa estrutura é fundamentalmente simples. Apesar de 
a solução QUARTIMAX ser analiticamente mais simples do 
que a VARIMAX, esta parece fornecer uma separação mais 
clara dos fatores. Em geral, o experimento de Kaiser [22, 23] 
indica que o padrão fatorial obtido por rotação VARIMAX 
tende a ser mais invariante do que o obtido pelo método 
QUARTIMAX quando diferentes subconjuntos de variáveis 
são analisados. O método VARIMAX tem sido muito bem- 
sucedido como uma abordagem analítica para a obtenção de 
uma rotação ortogonal de fatores. 

3. O método EQUIMAX é uma espécie de meio-termo entre 
QUARTIMAX e VARIMAX. Em vez de se concentrar na 
simplificação de linhas ou de colunas, ele tenta atingir um 
pouco de cada. EQUIMAX não tem obtido ampla aceita- 
ção e é pouco usado. 


Métodos de rotação oblíqua. As rotações oblíquas são 
semelhantes às ortogonais, porém as oblíquas permitem fa- 
tores correlacionados em vez de manterem independência 
entre os fatores rotacionados. Porém, enquanto há várias 
escolhas entre abordagens ortogonais, há apenas escolhas 
limitadas na maioria dos pacotes estatísticos para rotações 
oblíquas. Por exemplo, SPSS fornece OBLIMIN; SAS 
tem PROMAX e ORTHOBLIQUE; e BMDP fornece 
DQUART, DOBLIMIN e ORTHOBLIQUE. Os objeti- 
vos de simplificação são comparáveis aos métodos ortogo- 
nais, com a característica extra de fatores correlacionados. 
Com a possibilidade de fatores correlacionados, o pesquisa- 
dor deve ter o cuidado extra de validar fatores rotacionados 
obliquamente, uma vez que eles têm uma maneira adicional 
(não-ortogonalidade) de se tornarem específicos à amostra 
e não-generalizáveis, particularmente com pequenas amos- 
tras ou pequenas proporções de casos por variáveis. 


Seleção entre métodos rotacionais. Nenhuma regra espe- 
cífica foi desenvolvida para guiar o pesquisador na seleção 
de uma técnica rotacional ortogonal ou oblíqua em particu- 
lar. Na maioria dos casos, o pesquisador simplesmente uti- 
liza a técnica rotacional dada pelo programa de computa- 
dor. A maioria dos programas tem como padrão de rotação 
o VARIMAX, mas todos os métodos rotacionais mais im- 
portantes estão amplamente disponíveis. No entanto, não 
há razão analítica para favorecer um método rotacional em 
detrimento de outro. A escolha de uma rotação ortogonal 
ou oblíqua deveria ser feita com base nas necessidades par- 
ticulares de um dado problema de pesquisa. Para essa fi- 


nalidade, diversas considerações (nas Regras Práticas 3-4) 
devem orientar a seleção do método rotacional. 


Julgamento da significância de cargas fatoriais 

Ao interpretar fatores, é preciso tomar uma decisão sobre 
quais cargas fatoriais vale a pena considerar. A discussão 
a seguir detalha questões relativas à significância prática e 
estatística, bem como ao número de variáveis, que afetam 
a interpretação de cargas fatoriais. 


Garantia de significância prática. A primeira orientação 
não é baseada em qualquer proposição matemática, mas se 
refere mais à significância prática ao fazer um exame pre- 
liminar da matriz fatorial em termos das cargas fatoriais. 
Como uma carga fatorial é a correlação da variável e do 
fator, a carga ao quadrado é a quantia de variância total 
da variável explicada pelo fator. Assim, uma carga de 0,30 
reflete aproximadamente 10% de explicação, e uma carga 
de 0,50 denota que 25% da variância é explicada pelo fator. 
A carga deve exceder 0,70 para que o fator explique 50% 
da variância de uma variável. Logo, quanto maior o valor 
absoluto da carga fatorial, mais importante a carga na in- 
terpretação da matriz fatorial. Usando significância prática 
como critério, podemos avaliar as cargas como se segue: 


e Cargas fatoriais na faixa de + 0,30 a + 0,40 são considera- 
das como atendendo o nível mínimo para interpretação de 
estrutura. 

e Cargas de + 0,50 ou maiores são tidas como praticamente 
significantes. 

e Cargas excedendo + (0,70% são consideradas indicativas de es- 
trutura bem definida e são a meta de qualquer análise fatorial. 


O pesquisador deve perceber que cargas extremamen- 
te altas (0,80 ou superiores) não são comuns e que a signi- 
ficância prática das cargas é um critério importante. Essas 
orientações são aplicáveis quando o tamanho da amostra 
é de 100 ou maior e onde a ênfase é a significância prática, 
e não estatística. 


Avaliação da significância estatística. Como anteriormen- 
te observado, uma carga fatorial representa a correlação 
entre uma variável original e seu fator. Ao determinar um 
nível de significância para a interpretação de cargas, uma 
abordagem semelhante à determinação da significância 


*N. de R.T.: O texto correto seria “+0,70”. 
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REGRAS PRÁTICAS 3-4 


Escolha de métodos de rotação fatorial 


e Métodos de rotação ortogonal 
e São os mais empregados 
e São os métodos preferidos quando o objetivo da 
pesquisa é redução de dados a um número menor 
de variáveis ou a um conjunto de medidas não- 
correlacionadas para uso subsequente em outras 
técnicas multivariadas 


e Métodos de rotação oblíqua 
e São mais adequados ao objetivo de se obter diversos 
fatores ou construtos teoricamente relevantes, 
pois, realisticamente falando, poucos construtos no 
mundo são não-correlacionados 


estatística de coeficientes de correlação poderia ser usada. 
Entretanto, pesquisas [14] têm demonstrado que as cargas 
fatoriais têm erros-padrão substancialmente maiores do que 
as correlações normais. Assim, as cargas fatoriais devem ser 
avaliadas em níveis consideravelmente mais restritos. O 
pesquisador pode empregar o conceito de poder estatístico 
discutido no Capítulo 1 para especificar cargas fatoriais con- 
sideradas significantes para diferentes tamanhos de amos- 
tra. Com o objetivo estabelecido de conseguir um nível de 
poder de 80%, o uso de um nível de significância de 0,05 e a 
inflação proposta dos erros padrão de cargas fatoriais, a Ta- 
bela 3-2 contém os tamanhos de amostra necessários para 
cada valor de carga fatorial ser considerado significante. 


Por exemplo, em uma amostra de 100 respondentes, as 
cargas fatoriais de 0,55 ou mais são significantes. No en- 
tanto, em uma amostra de 50, é exigida uma carga fa- 
torial de 0,75 para significância. Em comparação com a 
regra prática anterior, que denotava todas as cargas de 
0,30 como tendo significância prática, essa abordagem 
consideraria cargas de 0,30 como significantes somente 
para amostras de 350 ou maiores. 


Essas são orientações muito conservadoras quando 
comparadas com as da seção anterior ou mesmo com ní- 
veis estatísticos associados aos coeficientes de correlação 
convencionais. Assim, essas orientações devem ser usadas 
como ponto de partida na interpretação de cargas fato- 
riais, sendo as cargas menores consideradas significantes e 
acrescentadas à interpretação com base em outras consi- 
derações. A seção a seguir detalha o processo de interpre- 
tação, bem como o papel de outras considerações. 

Ajustes baseados no número de variáveis. Uma des- 
vantagem das duas abordagens anteriores é que o número 
de variáveis analisadas e o fator específico em exame não 
são considerados. Foi mostrado que quando o pesquisa- 
dor se move do primeiro fator para fatores posteriores, 


TABELA 3-2 Diretrizes para identificação de cargas fatoriais 
significantes com base em tamanho de amostra 


Tamanho da amostra 


Carga fatorial necessário para significância” 


0,30 350 
0,35 250 
0,40 200 
0,45 150 
0,50 120 
0,55 100 
0,60 85 
0,65 70 
0,70 60 
0,75 50 


*Significância se baseia em um nível de significância (o) de 0,05, um nível de 
poder de 80%, e erros-padrão considerados como o dobro daqueles de coefi- 
cientes de correlação convencionais 


Fonte: Cálculos feitos com SOLO Power Analysis, BMDP Statistical Software, 
Inc., 1993. 


o nível aceitável para que uma carga seja julgada signi- 
ficante deve aumentar. O fato de que a variância única 
e a variância do erro começam a surgir em fatores pos- 
teriores significa que algum ajuste para cima no nível de 
significância deve ser incluído [22]. O número de variáveis 
em análise também é importante na decisão sobre quais 
cargas são significantes. À medida que o número de variá- 
veis em análise aumenta, o nível aceitável para considerar 
uma carga significante diminui. O ajuste para o número de 
variáveis é cada vez mais importante à medida que se vai 
do primeiro fator extraído para fatores posteriores. 

As Regras Práticas 3-5 resumem os critérios para sig- 
nificância prática ou estatística de cargas fatoriais. 


REGRAS PRÁTICAS 3-5 


Avaliação de cargas fatoriais 


e Apesar de cargas fatoriais de + 0,30 a + 0,40 serem 
minimamente aceitáveis, valores maiores que + 0,50 são 
geralmente considerados necessários para significância 
prática 


A ser considerado significante: 

e Uma carga menor com uma amostra maior ou um 
número maior de variáveis sob análise 
Uma carga maior faz-se necessária com uma 
solução fatorial com um número maior de fatores, 
especialmente na avaliação de cargas em fatores 
posteriores 


Testes estatísticos de significância para cargas 
fatoriais são geralmente conservadores e devem 

ser considerados apenas como pontos de partida 
necessários para inclusão de uma variável para futura 
consideração 
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Interpretação de uma matriz fatorial 

A tarefa de interpretar uma matriz de cargas fatoriais para 
identificar a estrutura entre as variáveis pode parecer à 
primeira vista muito complicada. O pesquisador deve clas- 
sificar todas as cargas fatoriais (lembre-se, cada variável 
tem uma carga sobre cada fator) para identificar as mais 
indicativas da estrutura latente. Mesmo uma análise rela- 
tivamente simples de 15 variáveis sobre 4 fatores precisa 
de avaliação e interpretação de 60 cargas fatoriais. Usan- 
do os critérios para interpretação de cargas descritos na 
seção anterior, o pesquisador descobre aquelas variáveis 
distintas para cada fator e procura uma correspondência 
com a fundamentação conceitual ou as expectativas ad- 
ministrativas depositadas na pesquisa para avaliar signi- 
ficância prática. Logo, interpretar as complexas relações 
representadas em uma matriz fatorial exige uma combi- 
nação da aplicação de critérios objetivos com julgamento 
gerencial. Seguindo-se o procedimento de cinco etapas 
delineado a seguir, o processo pode ser simplificado consi- 
deravelmente. Depois da discussão sobre o processo, um 
breve exemplo será usado para ilustrá-lo. 


Etapa 1: Examine a matriz fatorial de cargas. A matriz 
de cargas fatoriais contém a carga fatorial de cada variável 
em cada fator. Elas podem ser cargas rotacionadas ou não- 
rotacionadas, mas, como anteriormente discutido, cargas 
rotacionadas são geralmente empregadas na interpretação 
fatorial a menos que a redução de dados seja o único obje- 
tivo. Tipicamente, os fatores são dispostos como colunas; 
assim, cada coluna de números representa as cargas de um 
único fator. Se uma rotação oblíqua foi usada, duas matri- 
zes fatoriais de cargas são fornecidas. A primeira é a ma- 
triz de padrão fatorial, a qual tem cargas que representam 
a contribuição única de cada variável ao fator. A segun- 
da é a matriz de estrutura fatorial, a qual tem correlações 
simples entre variáveis e fatores, mas essas cargas contêm 
tanto a variância única entre variáveis e fatores quanto a 
correlação entre fatores. À medida que a correlação entre 
fatores se torna maior, fica mais difícil distinguir quais va- 
riáveis têm cargas únicas em cada fator na matriz de estru- 
tura fatorial. Logo, a maioria dos pesquisadores relata os 
resultados da matriz de padrão fatorial. 


Etapa 2: Identifique a(s) carga(s) significante(s) para cada 
variável. A interpretação deve começar com a primeira 
variável no primeiro fator e se mover horizontalmente da 
esquerda para a direita, procurando a carga mais alta para 
aquela variável em qualquer fator. Quando a maior car- 
ga (em valor absoluto) é identificada, deve ser sublinha- 
da se for significante como determinado pelos critérios 
anteriormente discutidos. A atenção agora se dirige para 
a segunda variável, e, novamente movendo-se horizon- 
talmente da esquerda para a direita, procura-se a maior 
carga para aquela variável em qualquer fator, e a mesma 
deve ser sublinhada. Esse procedimento deve continuar 
para cada variável até que todas as variáveis tenham sido 
revistas quanto às suas maiores cargas em um fator. 


Entretanto, a maioria das soluções fatoriais não resulta 
em uma estrutura simples (uma única carga alta para cada 
variável em um único fator). Logo, o pesquisador continu- 
ará, depois de sublinhar a carga mais alta de uma variável, 
a avaliar a matriz fatorial, sublinhando todas as cargas sig- 
nificantes para uma carga em todos os fatores. O processo 
de interpretação seria extremamente simplificado se cada 
variável tivesse apenas uma variável* significante. Na prá- 
tica, no entanto, o pesquisador pode descobrir que uma 
ou mais variáveis tem cargas de tamanho moderado sobre 
diversos fatores, todas significantes, e o trabalho de inter- 
pretar fatores torna-se muito mais difícil. Quando uma 
variável demonstra ter mais de uma carga significante, ela 
é chamada de carga cruzada. 

A dificuldade surge porque uma variável com diversas 
cargas significantes (uma carga cruzada) deve ser usada 
na rotulação de todos os fatores nos quais ela tem uma 
carga significante. No entanto, como os fatores podem ser 
distintos e potencialmente representar conceitos separa- 
dos quando eles “compartilham” variáveis? Em última 
análise, o objetivo é minimizar o número de cargas sig- 
nificantes sobre cada linha da matriz fatorial (i.e., fazer 
com que cada variável se associe com um único fator). O 
pesquisador pode descobrir que diferentes métodos de ro- 
tação eliminam cargas cruzadas e, portanto, definem uma 
estrutura simples. Se uma variável persiste em ter cargas 
cruzadas, ela se torna candidata à eliminação. 


Etapa 3: Avalie as comunalidades das variáveis. Uma 
vez que todas as cargas significantes tenham sido identifi- 
cadas, o pesquisador deve procurar por variáveis que não 
sejam adequadamente explicadas pela solução fatorial. 
Uma abordagem simples é identificar variáveis nas quais 
faltam pelo menos uma carga significante. Outro método é 
examinar a comunalidade de cada variável, representando 
a quantia de variância explicada pela solução fatorial para 
cada variável. O pesquisador deve ver as comunalidades 
para avaliar se as variáveis atendem níveis aceitáveis de 
explicação. Por exemplo, um pesquisador pode especificar 
que pelo menos metade da variância de cada variável deve 
ser levada em conta. Usando essa diretriz, o pesquisador 
identificaria todas as variáveis com comunalidades meno- 
res que 0,50 como não tendo explicação suficiente. 


Etapa 4: Reespecifique o modelo fatorial se neces-sá- 
rio. Uma vez que todas as cargas significantes tenham 
sido identificadas e as comunalidades, examinadas, o pes- 
quisador pode encontrar diversos problemas: (a) uma 
variável não tem cargas significantes; (b) mesmo com 
uma carga significante, a comunalidade de uma variável 
é considerada muito baixa, ou (c) uma variável tem uma 
carga cruzada. Nesta situação, o pesquisador pode execu- 
tar qualquer combinação das seguintes ações corretivas, 
listadas da menos para a mais extrema: 


*N. de R. T.: A frase correta seria “se cada variável tivesse apenas 
uma carga significante”. 
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e Ignorar aquelas variáveis problemáticas e interpretar a solu- 
ção como ela é, o que é apropriado se o objetivo é somente 
redução de dados, mas o pesquisador deve ainda observar 
que as variáveis em questão são pobremente representadas 
na solução fatorial. 

e Avaliar cada uma daquelas variáveis para possível eliminação, 
dependendo da contribuição geral da variável para a pesqui- 
sa, bem como de seu índice de comunalidade. Se a variável é 
de menor importância para o objetivo do estudo ou tem um 
valor inaceitável de comunalidade, ela pode ser eliminada, e o 
modelo pode então ser reespecificado pela derivação de uma 
nova solução fatorial com aquelas variáveis eliminadas. 

e Empregar um método alternativo de rotação, particular- 
mente um método oblíquo, caso apenas métodos ortogonais 
tenham sido usados. 

e Diminuir/aumentar o número de fatores mantidos para ver 
se uma estrutura fatorial menor/maior representará aquelas 
variáveis problemáticas. 

e Modificar o tipo de modelo fatorial usado (componentes 
versus fatores comuns) para avaliar se mudanças do tipo de 
variância considerada afetam a estrutura fatorial. 


Quaisquer que sejam as opções escolhidas pelo pesquisa- 
dor, o objetivo final deve sempre ser a obtenção de uma 
estrutura fatorial com apoio tanto empírico quanto con- 
ceitual. Como vimos, muitos “truques” podem ser utili- 
zados para melhorar a estrutura, mas a responsabilidade 
final está com o pesquisador e com a fundamentação con- 
ceitual subjacente à análise. 


Etapa 5: Rotule os fatores. Quando é obtida uma solu- 
ção fatorial aceitável na qual todas as variáveis têm uma 
carga significante em um fator, o pesquisador tenta desig- 
nar algum significado para o padrão de cargas fatoriais. 
As variáveis com cargas mais altas são consideradas mais 
importantes e têm maior influência sobre o nome ou ró- 
tulo selecionado para representar um fator. Assim, o pes- 
quisador examina todas as variáveis significantes para 
um fator particular e, enfatizando aquelas variáveis com 
maiores cargas, tenta designar um nome ou rótulo para 
um fator que reflita com precisão as variáveis com carga 
naquele fator. Os sinais são interpretados simplesmente 
como quaisquer outros coeficientes de correlação. Em 
cada fator, sinais concordantes significam que as variáveis 
estão positivamente relacionadas, e sinais opostos signi- 
ficam que as variáveis estão negativamente relacionadas. 
Em soluções ortogonais, os fatores são independentes uns 
dos outros. Portanto, os sinais para cargas fatoriais rela- 
cionam-se apenas com o fator no qual elas aparecem, e 
não com outros fatores na solução. 

Esse rótulo não é determinado ou designado pelo pro- 
grama computacional que realiza a análise fatorial; em 
vez disso, o rótulo é desenvolvido intuitivamente pelo 
pesquisador com base em sua adequação para represen- 
tar as dimensões latentes de um fator particular. Segue-se 
esse procedimento para cada fator extraído. O resultado 
final será um nome ou rótulo que represente cada fator 
determinado da melhor maneira possível. 


Como discutido anteriormente, a seleção de um núme- 
ro específico de fatores e o método de rotação são inter- 
relacionados. Várias tentativas adicionais de rotações 
podem ser executadas, e, comparando as interpretações 
fatoriais para diversas tentativas de rotações diferentes, o 
pesquisador pode selecionar o número de fatores a extrair. 
Em resumo, a habilidade de designar algum significado 
aos fatores, ou de interpretar a natureza das variáveis, se 
torna uma consideração extremamente importante ao se 
determinar o número de fatores a serem extraídos. 


Um exemplo de interpretação fatorial. Para servir como 
ilustração de interpretação fatorial, nove medidas foram 
obtidas em um teste piloto baseado em uma amostra de 
202 respondentes. Após a estimação dos resultados iniciais, 
análises posteriores indicaram que uma solução com três 
fatores era adequada. Logo, agora o pesquisador tem a ta- 
refa de interpretar as cargas fatoriais das nove variáveis. 


A Tabela 3-3 contém uma série de matrizes de cargas 
fatoriais. A primeira a ser considerada é a matriz fatorial 
não-rotacionada (parte a). Examinaremos as matrizes de 
cargas fatoriais não-rotacionadas e rotacionadas através 
do processo de cinco etapas anteriormente descrito. 


Etapas 1 e 2: Examinar a matriz de cargas fatoriais e 
identificar cargas significantes. Dado o tamanho da 
amostra de 202, cargas fatoriais de 0,40 ou mais serão 
consideradas significantes para fins de interpretação. 
Usando esse padrão para as cargas fatoriais, podemos 
ver que a matriz não-rotacionada contribui pouco para 
se identificar qualquer forma de estrutura simples. Cinco 
das nove variáveis têm cargas cruzadas, e para muitas 
das outras variáveis as cargas significantes são relativa- 
mente baixas. Nesta situação, rotação pode melhorar 
nossa compreensão da relação entre as variáveis. 

Como mostrado na Tabela 3-3b, a rotação VARI- 
MAX melhora consideravelmente a estrutura de duas 
maneiras notáveis. Primeiro, as cargas são melhoradas 
para quase todas as variáveis, com as mesmas mais pro- 
ximamente alinhadas ao objetivo de se ter uma elevada 
carga sobre um único fator. Segundo, agora somente 
uma variável (V,) tem uma carga cruzada. 


Etapa 3: Avaliar comunalidades. Apenas V, tem uma 
comunalidade que é baixa (0,299). Para nossos propósi- 
tos V, será mantida, mas um pesquisador pode conside- 
rar a eliminação de tais variáveis em outros contextos 
de pesquisa. Isso ilustra o caso em que uma variável tem 
uma carga significante, mas pode ainda ser pobremente 
explicada pela solução fatorial. 


Etapa 4: Reespecificar o modelo fatorial se necessário. 
Se estabelecemos um valor de referência de 0,40 para 
significância de carga e novamente arranjamos as variá- 
veis de acordo com cargas, emerge o padrão exibido na 


(Continua) 
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(Continuação) 

Tabela 3-3c. As variáveis V., Voe V, têm cargas elevadas 
sobre o fator 1, o fator 2 é caracterizado pelas variáveis 
Vs V,e V; e o fator 3 tem duas características distintas 
(V, e V5). Somente V, é problemática, com cargas signi- 
ficantes sobre os fatores 1 e 3. Sabendo que pelo menos 
duas variáveis são dadas sobre esses dois fatores, V, é 
eliminada da análise e as cargas são novamente calcu- 
ladas. 


Etapa 5: Rotular os fatores. Como mostrado na Tabela 
3-3d, a estrutura fatorial para as oito variáveis remanes- 
centes é agora muito bem definida, representando três 
grupos distintos de variáveis que o pesquisador pode 
agora utilizar em pesquisas posteriores. 


Como se mostra no exemplo anterior, o processo de 
interpretação de fatores envolve julgamentos tanto obje- 
tivos quanto subjetivos. O pesquisador deve considerar 
uma vasta gama de questões o tempo todo, nunca perden- 
do de vista a meta final de definir a melhor estrutura do 
conjunto de variáveis. Apesar de muitos detalhes estarem 
envolvidos, alguns dos princípios gerais são encontrados 
nas Regras Práticas 3-6. 


REGRAS PRÁTICAS 3-6 


Interpretação dos fatores 


Existe uma estrutura ótima quando todas as variáveis 
têm cargas altas em um único fator 

Variáveis com carga cruzada (cargas elevadas sobre 
dois ou mais fatores) são geralmente eliminadas 

a menos que sejam teoricamente justificadas ou o 
objetivo seja apenas redução de dados. 

Variáveis em geral deveriam ter comunalidades 
maiores que 0,50 para serem mantidas na análise. 
Reespecificação de uma análise fatorial pode incluir 
opções como as que se seguem: 

e Eliminar uma ou mais variáveis 

e Mudar os métodos de rotação 

e Aumentar ou diminuir o número de fatores 


Estágio 6: Validação da análise fatorial 


O sexto estágio envolve a avaliação do grau de generalida- 
de dos resultados para a população e da influência poten- 
cial de casos ou respondentes individuais sobre os resulta- 
dos gerais. A questão da generalidade é crítica para todo 
método multivariado, mas é especialmente relevante nos 
métodos de interdependência, pois eles descrevem uma 
estrutura de dados que também deve ser representativa da 
população. No processo de validação, o pesquisador deve 
abordar várias questões na área de delineamento de pes- 
quisa e características de dados, como discutido a seguir. 


Uso de uma perspectiva confirmatória 

O método mais direto para validar os resultados é partir 
para uma perspectiva confirmatória e avaliar a repetitivi- 
dade dos resultados, seja com uma amostra particionada no 
conjunto de dados originais, seja com uma amostra separa- 
da. A comparação de dois ou mais resultados de um modelo 
fatorial sempre é problemática. No entanto, existem várias 
opções para realizar uma comparação objetiva. A emer- 
gência da análise fatorial confirmatória (CFA) por meio 
da modelagem de equações estruturais tem fornecido uma 
opção, mas geralmente é mais complicada e exige pacotes 
computacionais adicionais, como LISREL ou EQS [4,21]. 
Os Capítulos 10 e 11 discutem a análise fatorial confirma- 
tória de forma mais detalhada. Além da CFA, diversos ou- 
tros métodos têm sido propostos, variando de um simples 
índice de emparelhamento [10] a programas (FMATCH) 
projetados especificamente para avaliar a correspondência 
entre matrizes fatoriais [34]. Esses métodos têm tido uso 
esporádico, devido em parte (1) à sua percebida falta de 
sofisticação e (2) à indisponibilidade de softwares ou pro- 
gramas analíticos para automatizar as comparações. Assim, 
quando a CFA não é adequada, esses métodos fornecem 
alguma base objetiva para a comparação. 


Avaliação da estabilidade da estrutura fatorial 
Um outro aspecto da generalidade é a estabilidade dos 
resultados do modelo fatorial. A estabilidade fatorial 
depende principalmente do tamanho da amostra e do 
número de casos por variável. O pesquisador sempre é 
encorajado a obter a maior amostra possível e a desenvol- 
ver modelos parcimoniosos para aumentar a proporção 
casos-por-variáveis. Se o tamanho da amostra permite, 
o pesquisador pode querer particionar aleatoriamente a 
amostra em dois subconjuntos e estimar modelos fatoriais 
para cada um. A comparação das duas matrizes fatoriais 
resultantes fornecerá uma avaliação da robustez da solu- 
ção ao longo das amostras. 


Detecção de observações influentes 

Além da generabilidade, uma outra questão importante 
para a validação da análise fatorial é a detecção de obser- 
vações influentes. Discussões no Capítulo 2 sobre a iden- 
tificação de observações atípicas, bem como no Capítulo 
4 sobre as observações influentes em regressão, encon- 
tram aplicabilidade em análise fatorial. O pesquisador é 
encorajado a estimar o modelo com e sem observações 
identificadas como atípicas para avaliar seu impacto nos 
resultados. Se a omissão das observações atípicas é jus- 
tificada, os resultados deveriam ter maior generalidade. 
Além disso, como discutido no Capítulo 4, diversas medi- 
das de influência que refletem a posição de uma observa- 
ção relativa a todas as outras (por exemplo, proporção de 
covariância) são igualmente aplicáveis à análise fatorial. 
Finalmente, a complexidade dos métodos propostos para 
identificação de observações influentes específicas à análi- 
se fatorial [11] limita a aplicação dos mesmos. 
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TABELA 3-3 


Interpretação de uma matriz hipotética de cargas fatoriais 


(a) Matriz de cargas fatoriais não-rotacionada 


(b) Matriz VARIMAX de cargas fatoriais rotacionada 


Fator Fator 
1 2 3 1 2 3 Comunalidade 
V, 0,611 0,250 —0,204 V, 0,462 0,099 0,505 0,477 
V, 0,614 —0,446 0,264 V, 0,101 0,778 0,173 0,644 
V, 0,295 —0,447 0,107 V, —0,134 0,517 0,114 0,299 
V, 0,561 —0,176 —0,550 V, —0,005 0,184 0,784 0,648 
V, 0,589 —0,467 0,314 V, 0,087 0,801 0,119 0,664 
V 0,630 —0,102 —0,285 A 0,180 0,302 0,605 0,489 
V, 0,498 0,611 0,160 V 0,795 —0,032 0,120 0,647 
Vs 0,310 0,300 0,649 Va 0,623 0,293 —0,366 0,608 
Y 0,492 0,597 —0,094 Y 0,694 —0,147 0,323 0,608 
(c) Matriz simplificada de cargas fatoriais (d) Matriz de cargas fatoriais rotacionada com V, 
rotacionada! eliminada? 
Componente Fator 
1 2 3 1 2 3 
V, 0,795 A 0,807 
VA 0,694 Vs 0,803 
V; 0,623 V, 0,524 
V. 0,801 Y 0,802 
V, 0,778 Y 0,686 
V, 0,517 Va 0,655 
v, 0,784 v, 0,851 
V 0,605 VA 0,717 
V, 0,462 0,505 


à Cargas menores que 0,40 não são exibidas, e variáveis 
são ordenadas pelas maiores cargas 


E V, eliminada da análise, cargas menores que 0,40 não são 
exibidas, e variáveis são ordenadas pelas maiores cargas 


Estágio 7: Usos adicionais dos 
resultados da análise fatorial 


Dependendo dos objetivos da aplicação da análise fato- 
rial, o pesquisador pode parar com a interpretação fato- 
rial ou utilizar-se de um dos métodos para redução de da- 
dos. Se o objetivo é simplesmente identificar combinações 
lógicas de variáveis e entender melhor as inter-relações 
entre variáveis, então a interpretação fatorial basta. Isso 
fornece uma base empírica para julgar a estrutura das va- 
riáveis e o impacto dessa estrutura quando se interpretam 
os resultados a partir de outras técnicas multivariadas. Se 
o objetivo, porém, é identificar variáveis apropriadas para 
a aplicação subsequente em outras técnicas estatísticas, 
então alguma forma de redução de dados será emprega- 
da. As duas opções incluem o seguinte: 


e Selecionar a variável com a maior carga fatorial como uma 
representativa substituta para uma dimensão fatorial par- 
ticular 


e Substituir o conjunto original de variáveis por um conjunto 
menor e inteiramente novo, criado a partir de escalas múlti- 
plas ou escores fatoriais. 


Qualquer opção fornecerá novas variáveis para uso, 
por exemplo, como variáveis independentes em uma aná- 
lise de regressão ou discriminante, variáveis dependentes 
em análise multivariada de variância, ou mesmo as variá- 
veis de agrupamento em análise de agrupamentos. Discu- 
timos cada uma dessas opções para redução de dados nas 
seções seguintes. 


Seleção de variáveis substitutas 

para análise subsegiiente 

Se a meta do pesquisador é simplesmente identificar variá- 
veis apropriadas para a aplicação subsegiiente com outras 
técnicas estatísticas, o pesquisador tem a opção de exami- 
nar a matriz fatorial e selecionar a variável com a maior 
carga fatorial em cada fator para atuar como uma variável 
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substituta representativa daquele fator. Essa é uma abor- 
dagem simples e direta somente quando uma variável tem 
uma carga fatorial bem maior do que todas as demais. Em 
muitos casos, porém, o processo de seleção é mais difícil 
porque duas ou mais variáveis têm cargas significantes e 
bastante próximas umas das outras, ainda que apenas uma 
seja escolhida como representativa de uma dimensão em 
particular. Essa decisão deve ser baseada no conhecimento 
a priori que o pesquisador tem da teoria, que pode sugerir 
que uma variável, mais que as outras, seria logicamente re- 
presentativa da dimensão. Além disso, o pesquisador pode 
ter conhecimento sugerindo que uma variável com carga le- 
vemente inferior é de fato mais confiável do que a variável 
com carga fatorial maior. Nesses casos, o pesquisador pode 
escolher a variável com carga ligeiramente menor como a 
melhor variável para representar um fator particular. 

O método de selecionar uma única variável substitu- 
ta como representativa do fator — apesar de ser simples e 
manter a variável original — tem várias desvantagens po- 
tenciais. 


e Não aborda a questão do erro de medida encontrada quando 
se usam medidas únicas (ver a seção seguinte para uma dis- 
cussão mais detalhada). 

e Também corre-se o risco de resultados potencialmente enga- 
nadores pela seleção de somente uma variável para represen- 
tar um resultado que talvez seja mais complexo. Por exemplo, 
suponha que variáveis que representem a competitividade 
de preço, a qualidade de produto e o valor fossem encon- 
tradas com elevadas cargas em um único fator. A seleção 
de uma dessas variáveis em separado criaria interpretações 
muito diferentes em qualquer análise posterior, ainda que 
todas possam estar tão intimamente relacionadas a ponto de 
tornar qualquer distinção definitiva impossível. 


Em casos nos quais diversas cargas elevadas complicam 
a seleção de uma única variável, o pesquisador pode não 
ter escolha a não ser empregar a análise fatorial como a 
base para calcular uma escala múltipla ou escores fatoriais 
para uso como uma variável substituta. O objetivo, como 
no caso da seleção de uma única variável, é representar 
melhor a natureza básica do fator ou do componente. 


Criação de escalas múltiplas 

O Capítulo 1 introduziu o conceito de uma escala múl- 
tipla, a qual é formada pela combinação de diversas va- 
riáveis individuais em uma única medida composta. Em 
termos simples, todas as variáveis com cargas elevadas em 
um fator são combinadas, e o total —- ou, mais comumente, 
o escore médio das variáveis — é usado como uma variável 
de substituição. Uma escala múltipla apresenta dois bene- 
fícios específicos. 


e Fornece um meio de superar consideravelmente o erro de 
medida inerente em todas as variáveis medidas. Erro de me- 
dida é o grau em que os valores observados não são repre- 
sentativos dos valores “reais” devido a diversas razões, que 
variam de erros reais (p.ex., erros na entrada de dados) à fal- 
ta de habilidade de indivíduos fornecerem informações pre- 


cisas. O impacto do erro de medida é mascarar parcialmen- 
te relações (p.ex., correlações ou comparações de médias de 
grupos) e dificultar a estimação de modelos multivariados. 
A escala múltipla reduz o erro de medida usando indicado- 
res (variáveis) múltiplos para reduzir a dependência de uma 
única resposta. Usando a resposta média ou típica de um 
conjunto de variáveis relacionadas, o erro de medida que 
poderia ocorrer em uma única questão será reduzido. 

e Um segundo benefício da escala múltipla é sua habilidade 
de representar os múltiplos aspectos de um conceito com uma 
medida única. Muitas vezes, empregamos mais variáveis em 
nossos modelos multivariados como uma tentativa de re- 
presentar as muitas facetas de um conceito que sabemos ser 
muito complexo. Entretanto, ao fazer isso, complicamos a 
interpretação dos resultados por causa da redundância nos 
itens associados ao conceito. Logo, gostaríamos de não ape- 
nas acomodar as descrições mais ricas de conceitos usando 
múltiplas variáveis, mas também de manter a parcimônia no 
número de variáveis em nossos modelos multivariados. A 
escala múltipla, quando corretamente construída, combina 
os múltiplos indicadores em uma só medida que representa 
o que acontece em comum no conjunto de medidas. 


O processo de construção de escala tem fundamentos 
teóricos e empíricos em diversas disciplinas, incluindo a 
teoria psicométrica, a sociologia e o marketing. Apesar de 
um tratamento completo das técnicas e questões envolvidas 
estarem além do escopo deste livro, existem várias fontes 
excelentes para leitura complementar sobre esse assunto 
[2,12,20,30,31]. Além disso, há uma série de compilações de 
escalas existentes que podem ser aplicadas em várias situa- 
ções [3,7,32]. Discutimos aqui, porém, quatro questões bási- 
cas para a construção de qualquer escala múltipla: definição 
conceitual, dimensionalidade, confiabilidade e validade. 


Definição conceitual. O ponto de partida para criar 
qualquer escala múltipla é sua definição conceitual. A de- 
finição conceitual especifica a base teórica para a escala 
múltipla definindo o conceito a ser representado em ter- 
mos aplicáveis ao contexto de pesquisa. Na pesquisa aca- 
dêmica, as definições teóricas são baseadas em pesquisa 
prévia que define o caráter e a natureza de um conceito. 
Em um contexto gerencial, conceitos específicos podem 
ser definidos de modo que se relacionem a objetivos pro- 
postos, como imagem, valor ou satisfação. Em qualquer 
caso, a criação de uma escala múltipla sempre é orientada 
pela definição conceitual, especificando o tipo e o caráter 
dos itens que são candidatos à inclusão na escala. 


A validade de conteúdo é a avaliação da correspondência 
das variáveis a serem incluídas em uma escala múltipla e 
sua definição conceitual. Essa forma de validade, também 
conhecida como validade de expressão, avalia subjeti- 
vamente a correspondência entre os itens individuais e 
o conceito por meio de avaliações de especialistas, pré- 
testes com múltiplas subpopulações ou outros meios. O 
objetivo é garantir que a seleção de itens de escala aborde 
não apenas questões empíricas, mas também inclua consi- 
derações práticas e teóricas [12,31]. 
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Dimensionalidade. Uma suposição inerente e exigência 
essencial para a criação de uma escala múltipla é que os 
itens sejam unidimensionais, significando que eles estão 
fortemente associados um com o outro e representam 
um só conceito [20,24]. A análise fatorial tem um papel 
essencial na realização de uma avaliação empírica da di- 
mensionalidade de um conjunto de itens, pela determi- 
nação do número de fatores e das cargas de cada variável 
nos mesmos. O teste de unidimensionalidade significa 
que cada escala múltipla deve consistir de itens com car- 
gas altas em um único fator [1,20,24,28]. Se uma escala 
múltipla é proposta como tendo múltiplas dimensões, 
cada dimensão deve ser refletida por um fator separado. 
O pesquisador pode avaliar unidimensionalidade com 
análise fatorial exploratória, como discutido neste capí- 
tulo, ou com análise fatorial confirmatória, como descrito 
nos Capítulos 10 e 11. 


Confiabilidade. Confiabilidade é uma avaliação do grau 
de consistência entre múltiplas medidas de uma variável. 
Uma forma de confiabilidade é teste/reteste, pelo qual a 
consistência é medida entre as respostas para um indiví- 
duo em dois pontos no tempo. O objetivo é garantir que 
as respostas não sejam muito variadas durante períodos 
de tempo, de modo que uma medida tomada em qualquer 
instante seja confiável. Uma segunda medida de confiabi- 
lidade, mais comumente usada, é a consistência interna, a 
qual avalia a consistência entre as variáveis em uma escala 
múltipla. A idéia da consistência interna é que os itens ou 
indicadores individuais da escala devem medir o mesmo 
construto, e assim serem altamente intercorrelacionados 
[12,28]. 

Como nenhum item isolado é uma medida perfeita de 
um conceito, devemos confiar em várias medidas diagnós- 
ticas para avaliar consistência interna. 


e As primeiras medidas que consideramos se relacionam a 
cada item separado, incluindo a correlação item-com-total 
(a correlação do item com o escore da escala múltipla) e a 
correlação inter-itens (a correlação entre itens). Regras prá- 
ticas sugerem que as correlações item-com-total excedam 
0,50 e que as correlações inter-itens excedam 0,30 [31]. 

e O segundo tipo de medida diagnóstica é o coeficiente de con- 
fiabilidade que avalia a consistência da escala inteira, sendo 
o alfa de Cronbach [15,28,29] a medida mais amplamente 
usada. O limite inferior para o alfa de Cronbach geralmente 
aceito é de 0,70 [31,32], apesar de poder diminuir para 0,60 
em pesquisa exploratória [31]. Uma questão na avaliação 
do alfa de Cronbach é sua relação positiva com o número 
de itens na escala. Como o aumento do número de itens, 
mesmo com grau igual de intercorrelação, aumenta o valor 
de confiabilidade, os pesquisadores devem fazer exigências 
mais severas para escalas com muitos itens. 

e Também estão disponíveis as medidas de confiabilidade 
determinadas a partir da análise fatorial confirmatória. In- 
cluídas nessas medidas estão a confiabilidade composta e a 
variância média extraída, discutidas mais detalhadamente 
no Capítulo 11. 


Cada um dos principais programas estatísticos agora 
tem módulos ou programas de avaliação de confiabili- 
dade, de modo que o pesquisador dispõe de uma análise 
completa tanto das medidas específicas de itens quanto de 
medidas gerais de confiabilidade. Qualquer escala múlti- 
pla deve ter sua confiabilidade analisada para garantir sua 
adequação antes de se proceder a uma avaliação de sua 
validade. 


Validade. Após garantir que uma escala (1) está de 
acordo com sua definição conceitual, (2) é unidimensio- 
nal e (3) atende aos níveis necessários de confiabilidade, 
o pesquisador deve fazer uma avaliação final: validade 
da escala. Validade é o grau em que uma escala ou um 
conjunto de medidas representa com precisão o conceito 
de interesse. Já vimos uma forma de validade — validade 
de conteúdo ou expressão — na discussão sobre definições 
conceituais. Outras formas de validade são medidas em- 
piricamente pela correlação entre conjuntos de variáveis 
teoricamente definidos. As três formas mais amplamente 
aceitas de validade são a convergente, a discriminante e a 
nomológica [8,30]. 


e A validade convergente avalia o grau em que duas medidas 
do mesmo conceito estão correlacionadas. Neste ponto, o 
pesquisador pode procurar medidas alternativas de um con- 
ceito e então correlacioná-las com a escala múltipla. Corre- 
lações altas indicam que a escala está medindo seu conceito 
pretendido. 

e A validade discriminante é o grau em que dois conceitos 
similares são distintos. O teste empírico é novamente a 
correlação entre medidas, mas dessa vez a escala múltipla 
está correlacionada com uma medida semelhante, mas con- 
ceitualmente distinta. Agora, a correlação deve ser baixa, 
demonstrando que a escala múltipla é suficientemente dife- 
rente do outro conceito semelhante. 

e Finalmente, a validade nomológica refere-se ao grau em que 
a escala múltipla faz previsões precisas de outros conceitos 
em um modelo teórico. O pesquisador deve identificar rela- 
ções teóricas a partir de pesquisa anterior ou de princípios 
aceitos e então avaliar se a escala tem relações correspon- 
dentes. Em resumo, a validade convergente confirma que a 
escala está correlacionada com outras medidas conhecidas 
do conceito; a validade discriminante garante que a escala é 
suficientemente diferente de outros conceitos semelhantes 
para ser distinta; e a validade nomológica determina se a es- 
cala demonstra as relações mostradas como existentes, com 
base em teoria ou pesquisa prévia. 


Vários métodos para avaliar a validade estão dispo- 
níveis, variando de matrizes multitraço, multimétodo 
(MTMM) a abordagens de equações estruturais. Apesar 
de estar além do escopo deste texto, diversas fontes dispo- 
níveis abordam vários métodos e as questões envolvidas 
nas técnicas específicas [8,21,30]. 


Cálculo de escalas múltiplas. O cálculo de escalas múlti- 
plas é um processo direto no qual os itens compreendendo 
a escala múltipla (i.e., os itens com cargas altas da análise 
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fatorial) são somados ou têm suas médias calculadas. A 
abordagem mais comum é considerar a média dos itens na 
escala, o que fornece ao pesquisador um controle comple- 
to sobre o cálculo e facilita o uso em análises posteriores. 
Sempre que variáveis têm cargas positivas e negativas 
dentro do mesmo fator, ou as variáveis com cargas positi- 
vas, ou aquelas com cargas negativas devem ter seus dados 
revertidos. Tipicamente, as variáveis com as cargas nega- 
tivas são revertidas no escore, de modo que correlações e 
cargas são agora todas positivas no mesmo fator. Escore 
reverso é o processo pelo qual os valores dos dados para 
uma variável são revertidos de forma que suas correlações 
com outras variáveis são revertidas (i.e., passam de nega- 
tivas para positivas). Por exemplo, em nossa escala de O a 
10, revertemos o escore de uma variável subtraindo o valor 
original de 10 (ou seja, escore reverso = 10 — valor origi- 
nal). Desse modo, escores originais de 10 e O agora têm os 
valores revertidos de 0 e 10. Todas as características de dis- 
tribuição são mantidas; apenas a distribuição é revertida. 
A meta do escore reverso é prevenir um anulamento 
de variáveis com cargas positivas e negativas. Usemos um 
exemplo de duas variáveis com correlação negativa. 


Estamos interessados em combinar V, e V,, com V, tendo 
carga positiva, e V,, negativa. Se 10 é o escore máximo em 
V,, o máximo em V, seria O. Agora considere dois casos. 
No caso 1, V, tem um valor igual a 10 e V, tem valor 0 
(o melhor caso). No segundo caso, V, tem um valor O e 
V, tem valor 10 (o pior caso). Se V, não é escore reverti- 
do, então o escore calculado pela soma das duas variáveis 
para ambos os casos é 10, mostrando nenhuma diferen- 
ça, apesar de sabermos que o caso 1 é melhore o2éo 
pior. Não obstante, se revertemos o escore V,, a situação 
muda. Agora o caso 1 tem valores 10e 10) em V, e V,, res- 
pectivamente, e o caso 2 tem valores O e 0. Os escores de 
escala múltipla são agora 20 para o caso 1 e O para o caso 
2, O que os distingue como a melhor e a pior situação. 


Resumo. As escalas múltiplas, um dos desenvolvimentos 
recentes em pesquisa acadêmica, estão encontrando apli- 
cação crescente em pesquisa aplicada e gerencial também. 
A habilidade da escala múltipla de representar conceitos 
complexos em uma única medida e ainda reduzir erros 
de medida a torna uma valiosa ferramenta em qualquer 
análise multivariada. A análise fatorial fornece ao pesqui- 
sador uma avaliação empírica das inter-relações entre va- 
riáveis, essencial na formação do fundamento conceitual 
e empírico de uma escala múltipla por meio da avaliação 
da validade de conteúdo e da dimensionalidade da escala 
(ver Regras Práticas 3-7). 


Cálculo de escores fatoriais 

A terceira opção para criar um conjunto menor de va- 
riáveis para substituir o conjunto original é o cálculo de 
escores fatoriais. Escores fatoriais também são medidas 
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Escalas múltiplas 


e Uma escala múltipla é apenas tão boa quanto os 
itens usados para representar o construto; ainda que 
possa passar em todos os testes empíricos, é inútil sem 
justificativa teórica 


Nunca crie uma escala múltipla sem primeiro 
avaliar sua unidimensionalidade com análise fatorial 
exploratória ou confirmatória 


Uma vez que uma escala é considerada unidimensional, 
seu escore de confiabilidade, medido pelo alfa de 
Cronbach: 


e Deve exceder uma referência de 0,70, apesar de 
um nível de 0,60 poder ser utilizado em pesquisa 
exploratória 


Deve ter seu valor de referência aumentado 
à medida que o número de itens aumenta, 
especialmente quando o número de itens se 
aproxima de 10 ou mais 


Com a confiabilidade estabelecida, a validade deve ser 
avaliada em termos de: 


e Validade convergente — a escala se correlaciona com 
outras escalas semelhantes 


Validade discriminante — a escala é suficientemente 
diferente de outras escalas relacionadas 


Validade nomológica — a escala “prevê” como 
teoricamente sugerido 


compostas de cada fator computadas para cada indivíduo. 
Conceitualmente, o escore fatorial representa o grau em 
que cada indivíduo tem escore elevado no grupo de itens 
que têm cargas elevadas em um fator. Assim, valores mais 
altos nas variáveis com cargas elevadas em um fator resul- 
tam em um escore fatorial superior. A característica-chave 
que diferencia um escore fatorial de uma escala múltipla 
é que o escore fatorial é computado com base nas cargas 
fatoriais de todas as variáveis no fator, enquanto a escala 
múltipla é calculada combinando-se apenas variáveis se- 
lecionadas. Portanto, apesar de o pesquisador ser capaz 
de caracterizar um fator pelas variáveis com as maiores 
cargas, ele também deve considerar as cargas das outras 
variáveis, embora menores, e sua influência no escore fa- 
torial. 

A maioria dos programas estatísticos computa facil- 
mente escores fatoriais para cada respondente. Selecio- 
nando-se a opção de escore fatorial, esses escores são sal- 
vos para uso em análises posteriores. A desvantagem dos 
escores fatoriais é que eles não são facilmente repetidos 
em estudos, pois são baseados na matriz fatorial, a qual é 
determinada separadamente em cada estudo. A repetição 
da mesma matriz fatorial em estudos requer substancial 
programação computacional. 
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Seleção entre os três métodos 

Para escolher entre as três opções de redução de dados, 
o pesquisador deve tomar várias decisões, ponderando as 
vantagens e desvantagens de cada abordagem com os ob- 
jetivos da pesquisa. As diretrizes nas Regras Práticas 3-8 
abordam as condições fundamentais associadas com cada 
método. 

A regra de decisão é, portanto, a seguinte: 


e Se dados são usados somente na amostra original ou se ortogo- 
nalidade deve ser mantida, escores fatoriais são adequados. 

e Se generalidade ou capacidade de transferência são dese- 
jáveis, então escalas múltiplas ou variáveis substitutas são 
mais apropriadas. Se a escala múltipla é um instrumento 
bem construído, válido e confiável, então é provavelmente 
a melhor alternativa. 


e Se a escala múltipla não é testada e é exploratória, com 
pouca ou nenhuma evidência de confiabilidade ou valida- 
de, variáveis substitutas deverão ser consideradas caso uma 
análise adicional não seja possível para melhorar a escala 
múltipla. 
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Representação da análise fatorial 
em outras análises 


e A variável substituta única 
Vantagens 
e Simples de administrar e interpretar 
Desvantagens 
e Não representa todas as “facetas” de um fator 
e Suscetível a erro de medida 


e Escores fatoriais 
Vantagens 
Representam todas as variáveis com cargas 
naquele fator 
Melhor método para completa redução de dados 
São naturalmente ortogonais e podem evitar 
complicações provocadas por multicolinearidade 
Desvantagens 
e Interpretação mais difícil, pois todas as variáveis 
contribuem com as cargas 
e Difícil de repetir em estudos 


e Escalas múltiplas 
Vantagens 
Conciliação entre a variável substituta e opções 
de escore fatorial 


Reduzem erro de medida 

Representam múltiplas facetas de um conceito 

Facilmente replicáveis em estudos 
Desvantagens 

Incluem apenas as variáveis com cargas elevadas 

sobre o fator e excluem aquelas com impacto 

pequeno ou periférico 

Não há necessariamente ortogonalidade 

Exigem análise extensiva de questões de 

confiabilidade e validade 


UM EXEMPLO ILUSTRATIVO 


Nas seções anteriores, as questões mais importantes re- 
ferentes à aplicação de análise fatorial foram discutidas 
dentro da estrutura de construção de modelos introdu- 
zida no Capítulo 1. Para melhor esclarecer esses tópicos, 
usamos um exemplo ilustrativo da aplicação de análise fa- 
torial baseado em informações da base de dados apresen- 
tada no Capítulo 1. Nossa discussão do exemplo empírico 
também segue o processo de construção de modelo em 
seis estágios. Os três primeiros estágios, comuns à aná- 
lise de componentes ou à análise de fatores comuns, são 
discutidos primeiramente. Em seguida, os estágios 4 a 6, 
de análise de componentes, serão discutidos, juntamente 
com exemplos do uso adicional de resultados fatoriais. 
Concluímos com um exame das diferenças em relação à 
análise de fatores comuns nos estágios 4 e 5. 


Estágio 1: Objetivos da análise fatorial 


A análise fatorial pode identificar a estrutura de um con- 
junto de variáveis, bem como fornecer um processo para 
a redução de dados. Em nosso exemplo, as percepções da 
HBAT sobre 13 atributos (X,a X,,) são examinadas pelos 
seguintes motivos: 


e Entender se essas percepções podem ser “agrupadas”. 
Mesmo o número relativamente pequeno de 
percepções examinadas aqui apresenta um complexo 
quadro de 78 correlações distintas. Agrupando as 
percepções, a HBAT será capaz de exibir o quadro 
geral em termos de compreensão de seus clientes e o 
que os mesmos pensam sobre a HBAT. 

e Reduzir as 13 variáveis a um número menor. Se as 13 
variáveis podem ser representadas em um número 
menor de variáveis compostas, então as outras técnicas 
multivariadas podem se tornar mais parcimoniosas. É 
claro que essa abordagem considera que exista algum 
arranjo latente nos dados em análise. 


Qualquer um ou ambos os objetivos podem ser encon- 
trados em uma questão de pesquisa, tornando a análise 
fatorial aplicável a uma vasta gama de questões. Além 
disso, como a base para o desenvolvimento de escalas 
múltiplas, ela tem conquistado cada vez maior uso nos 
últimos anos. 


Estágio 2: Planejamento de 
uma análise fatorial 


Compreender a estrutura das percepções de variáveis re- 
quer análise fatorial do tipo R e uma matriz de correla- 
ções entre variáveis, não respondentes. Todas as variáveis 
são métricas e constituem um conjunto homogêneo de 
percepções adequado à análise fatorial. 
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O tamanho da amostra neste exemplo tem uma propor- 
ção de 8:1 na razão entre observações e variáveis, o que 
está dentro de limites aceitáveis. Além disso, o tamanho 
da amostra de 100 fornece uma base adequada para o 
cálculo das correlações entre variáveis. 


Estágio 3: Suposições em análise fatorial 


As suposições estatísticas subjacentes causam um impacto 
na análise fatorial, no sentido de que afetam as correlações 
determinadas. Desvios da normalidade, homocedasticida- 
de e linearidade podem diminuir as correlações entre va- 
riáveis. Essas suposições são examinadas no Capítulo 2, 
e convidamos o leitor a rever os resultados das investiga- 
ções. O pesquisador também deve avaliar a viabilidade da 
análise fatorial a partir da matriz de correlação. O primei- 
ro passo é um exame visual das correlações, identificando 
as que são estatisticamente significantes. 


A Tabela 3-4 mostra a matriz de correlação para as 13 
percepções da HBAT. A inspeção da matriz de correla- 
ção revela que 29 das 78 correlações (37%) são signifi- 
cantes no nível 0,01, o que fornece uma base adequada 
a seguir para um exame empírico da adequação para a 
análise fatorial tanto em uma base geral quanto para cada 
variável. A tabulação do número de correlações signifi- 
cantes por variável apresenta um intervalo de O (X,5) a 9 
(X,;). Apesar de não existirem limites sobre o que é alto 
ou baixo demais, variáveis sem correlações significantes 
podem não ser parte de qualquer fator, e se uma variável 
tem um grande número de correlações, ela pode ser par- 
te de diversos fatores. Podemos observar esses padrões e 
ver como eles são refletidos à medida que a análise pros- 
segue. 


O pesquisador pode avaliar a significância geral da 
matriz de correlação com o teste de Bartlett e a fatorabili- 
dade do conjunto geral de variáveis e variáveis individuais 
usando a medida de adequação de amostra (MSA). Como 
a análise fatorial sempre gera fatores, o objetivo é garantir 
um nível de referência de correlação estatística dentro do 
conjunto de variáveis, de modo que a estrutura fatorial 
resultante tenha alguma base objetiva. 


Neste exemplo, o teste de Bartlett revela que as corre- 
lações, quando tomadas coletivamente, são significantes 
no nível de 0,0001 (ver Tabela 3-4). Este teste indica 
apenas a presença de correlações não-nulas, e não o 
padrão dessas correlações. A medida de adequação da 
amostra (MSA) olha não apenas as correlações, mas 
seus padrões entre variáveis. Nessa situação, o valor ge- 
ral MSA está no nível aceitável (acima de 0,50), com um 
valor de 0,609. O exame dos valores para cada variável, 


porém, identifica três variáveis (X,, X,; € X,,) que têm 
valores MSA abaixo de 0,50. Como X,, tem o menor va- 
lor MSA, essa variável será omitida na tentativa de obter 
um conjunto de variáveis que possam exceder os níveis 
MSA mínimos aceitáveis. Recalculando os valores MSA, 
percebe-se que X,, ainda tem um valor MSA individual 
abaixo de 0,50, e portanto também é eliminada da análi- 
se. Devemos observar neste ponto que X,,e X,, eram as 
duas variáveis com o número de correlações significan- 
tes mais baixo e o mais elevado, respectivamente. 

A Tabela 3-5 contém a matriz de correlação para o 
conjunto revisado de variáveis (X,; e X,, eliminadas) jun- 
to com as medidas de adequação da amostra e o valor 
do teste de Bartlett. Na matriz de correlação reduzida, 
20 das 55 correlações são estatisticamente significantes. 
Como no caso do conjunto completo de variáveis, o teste 
de Bartlett mostra que as correlações não-nulas existem 
no nível de significância de 0,0001. O conjunto reduzi- 
do de variáveis atende coletivamente à base necessária 
de adequação da amostra com um valor MSA de 0,653. 
Cada variável também excede o valor base, indicando 
que o conjunto reduzido de variáveis atende aos requi- 
sitos fundamentais para a análise fatorial. Finalmente, o 
exame das correlações parciais mostra apenas cinco com 
valores maiores que 0,50 (X,-X,,X;-X |, XX 1X Xe, € 
XX), que é outro indicador da força das relações en- 
tre as variáveis no conjunto reduzido. Vale observar que 
ambas X,, e X,, estão envolvidas em duas das correlações 
parciais elevadas. Coletivamente, todas essas medidas in- 
dicam que o conjunto reduzido de variáveis é adequado 
à análise fatorial, e a análise pode prosseguir para os pró- 
ximos estágios. 


Análise fatorial de componentes: estágios 4 a 7 


Como anteriormente observado, os procedimentos da 
análise fatorial são baseados na computação inicial de 
uma tabela completa de intercorrelações entre as variá- 
veis (matriz de correlação). A matriz de correlação é en- 
tão transformada por meio de estimação de um modelo 
fatorial para obter uma matriz fatorial contendo cargas 
fatoriais para cada variável em cada fator obtido. As car- 
gas de cada variável nos fatores são então interpretadas 
para identificar a estrutura latente das variáveis, nesse 
caso, percepções da HBAT. Esses passos de análise fa- 
torial, contidos nos estágios de 4 a 7, são examinados pri- 
meiramente para análise de componentes. Em seguida, 
uma análise de fatores comuns é executada, e são feitas 
comparações entre os dois modelos fatoriais. 


Estágio 4: Determinação de fatores 

e avaliação do ajuste geral 

Sabendo-se que o método de componentes para extra- 
ção será usado primeiro, a próxima decisão é escolher o 
número de componentes a ser retido para posterior aná- 
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lise. Como anteriormente discutido, o pesquisador deve TABELA 3-6 Resultados para a extração de fatores componentes 
empregar diversos critérios distintos para determinar o 


número de fatores a serem mantidos para interpretação, 


Autovalores 


variando dos mais subjetivos (p.ex., escolha a priori de um Percentualde Percentual 
número de fatores ou especificação do percentual de va- Gomprnente Total enero eurmalertivo 
riância extraída) aos mais objetivos (critério da raiz laten- 1 3,43 31,2 31,2 
te ou teste scree). 2 2,55 23,2 54,3 
3 1,69 15,4 69,7 
A Tabela 3-6 contém a informação sobre os 11 fatores 4 1,09 9,9 79,6 
possíveis e seu poder explanatório relativo expresso por 5 061 55 851 
seus autovalores. Além da avaliação da importância de 
cada componente, também podemos usar os autova- a ço Sl supe 
lores para auxiliar na seleção do número de fatores. O 7 0,40 3,7 93,8 
pesquisador não está limitado a opiniões prévias sobre 8 0,25 2,2 96,0 
o número de fatores que devem ser mantidos, mas por 9 0,20 19 979 
razões práticas de se desejarem múltiplas medidas por 
Ê 10 0,13 1,2 99,1 
fator que sugerem que entre 3 e 5 fatores seriam melhor 
11 0,10 0,9 100,0 


associados às 11 variáveis sob análise. Se aplicarmos o 
critério da raiz latente para manter fatores com autova- 
lores maiores do que 1,0, quatro fatores serão mantidos. 
O teste scree (Figura 3-9), porém, indica que cinco fa- 
tores podem ser apropriados quando se consideram as 


significado substantivo dos fatores (p.ex., como variáveis 
preditoras em uma relação de dependência). O objetivo 


mudanças em autovalores (i.e., identificar o “ângulo” 
nos autovalores). Ao ver o autovalor para o quinto fa- 
tor, determinou-se que seu baixo valor (0,61) em relação 
ao valor 1,0 do critério da raiz latente inviabiliza sua in- 
clusão. Se o autovalor estivesse bem próximo de 1, en- 
tão poderia também ser considerado para inclusão. Os 
quatro fatores retidos representam 79,6% da variância 
das 11 variáveis, considerado suficiente em termos de 


da análise fatorial nesses casos é maximizar a associação 
de cada variável com um único fator, muitas vezes por 
meio de rotação da matriz fatorial. O pesquisador deve 
julgar quanto à adequação da solução neste estágio e sua 
representação da estrutura de variáveis e a habilidade de 
atender às metas da pesquisa. Examinamos primeiramen- 
te a solução sem rotação e determinamos se o uso da solu- 
ção com rotação é necessário. 


variância total explicada. Combinar todos esses critérios 
conduz à conclusão de manter quatro fatores para poste- 
rior análise. Mais importante, esses resultados ilustram a 
necessidade por critérios múltiplos de decisão na defini- 
ção do número de componentes a serem mantidos. 


Estágio 5: Interpretação dos fatores 

Com quatro fatores a serem analisados, o pesquisador 
agora se volta à interpretação dos fatores. Uma vez que 
a matriz fatorial de cargas tenha sido calculada, o proces- 
so de interpretação prossegue com o exame de matrizes 
não-rotacionadas e em seguida as rotacionadas, para de- 
tectar cargas significantes e comunalidades adequadas. Se 
deficiências são encontradas, reespecificação dos fatores é 
considerada. Uma vez que os fatores estejam finalizados, 
eles podem ser descritos com base nas cargas fatoriais sig- 
nificantes caracterizando cada fator. 


Etapa 1: Examine a matriz fatorial de cargas para a matriz 
fatorial não-rotacionada. Cargas fatoriais, sejam em ma- 
trizes não-rotacionadas ou rotacionadas, representam o 
grau de associação (correlação) de cada variável com cada 
fator. As cargas desempenham um papel importante na 
interpretação dos fatores, particularmente se elas forem 
usadas de maneiras que exijam caracterização quanto ao 


A Tabela 3-7 apresenta a matriz fatorial não-rotacionada 
da análise de componentes. Para iniciar a análise, expli- 
quemos os números incluídos na tabela. Cinco colunas 
de números são mostradas. As quatro primeiras são os 
resultados para os quatro fatores extraídos (ou seja, car- 
gas fatoriais de cada variável em cada fator). A quinta 
coluna fornece estatísticas resumidas detalhando quão 
bem cada variável é explicada pelas quatro componen- 
tes, as quais são discutidas na próxima seção. A primeira 
linha de números na parte inferior de cada coluna é a 
soma da coluna de cargas fatoriais ao quadrado (autova- 
lores) e indica a importância relativa de cada fator na ex- 
plicação da variância associada ao conjunto de variáveis. 
Note que as somas dos quadrados para os quatro fatores 
são 3,427, 2,551, 1,691 e 1,087, respectivamente. Como 
esperado, a solução fatorial extrai os fatores na ordem 
de sua importância, com fator 1 explicando a maior par- 
te da variância, o fator 2 ligeiramente menos, e assim por 
diante ao longo de todos os 11 fatores. Na extremidade 
à direita da linha está o número 8,756, que representa o 
total dos quatro autovalores (3,427+2,551+1,691+1,087). 
O total de autovalores representa a quantia total de va- 
riância extraída pela solução fatorial. 
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FIGURA 3-9 Teste scree para análise de componentes. 


A quantia total de variância explicada por um fator ou 
pela solução fatorial geral pode ser comparada com a va- 
riação total no conjunto de variáveis que é representada 
pelo traço da matriz fatorial. O traço é a variância total a 
ser explicada e é igual à soma dos autovalores do conjunto 
de variáveis. Em análise de componentes, o traço é igual 
ao número de variáveis, visto que cada variável tem um 
autovalor possível de 1,0. Acrescentando os percentuais 
de traço para cada um dos fatores (ou dividindo o total 
de autovalores dos fatores pelo traço), obtemos o percen- 
tual total de traço extraído para a solução fatorial. Esse 
total é usado como um índice para determinar o quão 
bem uma solução fatorial em particular explica aquilo que 
todas as variáveis juntas representam. Se as variáveis são 
todas muito diferentes umas das outras, esse índice será 
pequeno. Se as variáveis recaem em um ou mais grupos 
altamente redundantes ou relacionados, e se os fatores 
extraídos explicam todos os grupos, o índice se aproxima- 
rá de 100%. 


Os percentuais de traço explicados por cada um dos 
quatro fatores (31,15%, 23,19%, 15,37% e 9,88%) são 
mostrados como a última linha de valores da Tabela 
3-7. O percentual de traço é obtido dividindo-se a soma 
de quadrados (autovalores) de cada fator pelo traço 
para o conjunto de variáveis analisado. Por exemplo, 
dividir a soma de quadrados de 3,427 para o fator 1 
pelo traço de 11,0 resulta no percentual de traço de 
31,154% para o fator 1. O índice para a solução ge- 
ral mostra que 79,59% da variância total (8,756/11,0) 
é representado pela informação contida na matriz fa- 
torial da solução em termos de quatro fatores. Logo, 
o índice para essa solução é alto, e as variáveis estão 
na realidade estreitamente relacionadas umas com as 
outras. 


Etapa 2: Identifique as cargas significantes na matriz fa- 
torial não-rotacionada Após definir os vários elementos 
da matriz fatorial não-rotacionada, examinemos os pa- 
drões de cargas fatoriais. Como discutido anteriormente, 
as cargas fatoriais permitem a descrição de cada fator e da 
estrutura no conjunto de variáveis. 


Como antecipado, o primeiro fator explica a maior quan- 
tia de variância na Tabela 3-7. O segundo fator é de al- 
gum modo um fator geral, com metade das variáveis 
tendo cargas elevadas (cargas altas são definidas como 
sendo maiores que 0,40). O terceiro fator tem duas cargas 
altas, enquanto o quarto tem apenas uma carga elevada. 
Com base nesse padrão de cargas fatoriais com um nú- 
mero relativamente grande de cargas elevadas no fator 
2 e somente uma no fator 4, a interpretação seria difícil 
e teoricamente menos significativa. Portanto, o pesqui- 
sador deve rotacionar a matriz fatorial para redistribuir 
a variância dos primeiros fatores para os seguintes. Ro- 
tação deve resultar em um padrão fatorial mais simples 
e teoricamente mais significativo. No entanto, antes de 
proceder com o processo de rotação, devemos examinar 
as comunalidades para ver se quaisquer variáveis têm co- 
munalidades tão baixas que elas devam ser eliminadas. 


Etapa 3: Avalie as comunalidades das variáveis na matriz 
fatorial não-rotacionada. A soma em linha de cargas fa- 
toriais quadradas, conhecida como comunalidade, mostra 
a quantia de variância em uma variável que é explicada 
pelos dois* fatores tomados juntos. O tamanho da comu- 
nalidade é um índice útil para avaliar o quanto de variân- 
cia em uma variável particular é explicado pela solução 
fatorial. Valores mais altos de comunalidade indicam 
que uma grande quantia da variância em uma variável 
foi extraída pela solução fatorial. Comunalidades peque- 
nas mostram que uma porção substancial da variância da 
variável não é explicada pelos fatores. A despeito de ne- 
nhuma diretriz estatística indicar exatamente o que é “pe- 
queno” ou “grande”, considerações práticas sugerem um 
nível mínimo de 0,50 para comunalidades nesta análise. 


As comunalidades na Tabela 3-7 são mostradas no ex- 
tremo direito da tabela. Por exemplo, a comunalidade 
de 0,576 para a variável X,, indica que ela tem menos em 
comum com as outras variáveis incluídas na análise do 
que X,, a qual tem uma comunalidade de 0,893. Ambas 
as variáveis, porém, ainda compartilham mais da meta- 
de de sua variância com os quatro fatores. Todas as co- 
munalidades são suficientemente altas para se proceder 
com a rotação da matriz fatorial. 


*N. de R. T.: A frase correta seria “pelos quatro fatores tomados 
juntos”. 


134 Análise Multivariada de Dados 


TABELA 3-7 Matriz de análise fatorial de componentes não-rotacionada 


Fator 

Variáveis 1 3 4 Comunalidade 
X, 0,248 -0,501 -0,081 0,670 0,768 
Qualidade do produto 
X, 0,307 0,713 0,306 0,284 0,777 
Comércio eletrônico 
X 0,292 -0,369 0,794 -0,202 0,893 
Suporte técnico 
X 0,871 -0,274 —0,215 0,881 
Solução de reclamações 
Xo 0,340 0,115 0,331 0,576 
Anúncio 
X 0,716  -0,455 -—0,151 0,212 0,787 
Linha de produto 
X 0,377 0,752 0,314 0,232 0,859 
Imagem da equipe de venda 
X -0,281 0,660  -0,069 -0,348 0,641 
Preço competitivo 
Xu 0,394 -0,306 0,778 -0,193 0,892 
Garantia e reclamações 
Xe 0,809 0,042 -0,220 -0,247 0,766 
Encomenda e cobrança 
Ka 0,876 0,117  -0,302 0,206 0,914 
Velocidade de entrega 

Total 
Soma de quadrados (autovalor) 3,427 1,691 1,087 8,756 
Percentual de traço? 31,15 23,19 15,37 9,88 79,59 


“Traço = 11,0 (soma de autovalores) 


Aplicação de uma rotação ortogonal (VARIMAX). Sa- 
bendo-se que a matriz fatorial não-rotacionada não tinha 
um conjunto de cargas fatoriais completamente limpo (ou 
seja, tinha cargas cruzadas substanciais ou não maximiza- 
va as cargas de cada variável em um fator), uma técnica 
de rotação pode ser aplicada para, com sorte, melhorar a 
interpretação. Nesse caso, a rotação VARIMAX é usada, 
e seu impacto sobre a solução fatorial geral e as cargas 
fatoriais é descrito a seguir. 


A matriz fatorial da análise de componentes rotaciona- 
da VARIMAX é mostrada na Tabela 3-8. Note que a 
quantia total de variância extraída na solução rotaciona- 
da é a mesma da não-rotacionada, 79,6%. Além disso, as 
comunalidades para cada variável não mudam quando 


nada. De modo semelhante, os outros fatores também 
mudam, sendo que a maior mudança ocorre no quarto, 
aumentando de 9,9% na solução não-rotacionada para 
16,1% na rotacionada. Assim, o poder explicativo mu- 
dou ligeiramente para uma distribuição mais equilibrada 
por causa da rotação. Segundo, a interpretação da matriz 
fatorial é simplificada. Como será discutido na próxima 
seção, as cargas fatoriais para cada variável são maximi- 
zadas para cada uma sobre um fator, exceto em casos de 
cruzamento de cargas. 


Etapas 2 e 3: Avalie as cargas fatoriais significantes e co- 
munalidades da matriz fatorial rotacionada. 


Com a rota- 


uma técnica de rotação é empregada. Entretanto, duas 
diferenças são visíveis. Primeiro, a variância é redis- 
tribuída de modo que o padrão de cargas fatoriais e o 
percentual de variância para cada fator é ligeiramente 
diferente. Especificamente, na solução fatorial rotacio- 
nada VARIMAX, o primeiro fator explica 26,3% da va- 
riância, comparado com 31,2% da solução não-rotacio- 


ção completa, o pesquisador agora examina a matriz fato- 
rial rotacionada quanto a padrões de cargas significantes, 
esperando encontrar uma estrutura simplificada. Se ainda 
persistirem problemas (i.e., cargas não-significantes para 
uma ou mais variáveis, cargas cruzadas ou comunalidades 
inaceitáveis), o pesquisador deve considerar reespecifica- 
ção da análise fatorial através do conjunto de opções dis- 
cutidas anteriormente. 
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TABELA 3-8 Matrizes de análise fatorial de componentes rotacionadas por VARIMAX: conjuntos completos e 
reduzidos de variáveis 


CARGAS ROTACIONADAS POR VARIMAXº 


Fator 

Conjunto completo de variáveis 1 2 3 4 Comunalidade 
Xj Velocidade de entrega 0,938 0,914 
X, Solução de reclamação 0,926 0,881 
Xe Encomenda & cobrança 0,864 0,766 
X, Imagem da equipe de venda 0,900 0,859 
X, Comércio eletrônico 0,871 0,777 
Xo Anúncio 0,742 0,576 
X; Suporte técnico 0,939 0,893 
X Garantia e reclamações 0,931 0,892 
X, Qualidade do produto 0,876 0,768 
X, Preço competitivo —0,723 0,641 
X, Linha de produto 0,591 0,642 0,787 

Total 
Soma de quadrados (autovalor) 2,893 2,234 1,855 1,774 8,756 
Percentual de traço 26,30 20,31 16,87 16,12 79,59 


? Cargas fatoriais menores que 0,40 não foram impressas, e as variáveis foram agrupadas por cargas em cada fator. 


CARGAS ROTACIONADAS POR VARIMAXº 


Fator 

Conjunto reduzido de variáveis 
(X, eliminada) 1 2 3 4 Comunalidade 
X, Solução de reclamação 0,933 0,890 
X, Velocidade de entrega 0,931 0,894 
Xe Encomenda & cobrança 0,886 0,806 
X, Imagem da equipe de venda 0,898 0,860 
X, Comércio eletrônico 0,868 0,780 
Xo Anúncio 0,743 0,585 
X; Suporte técnico 0,940 0,894 
X, Garantia e reclamações 0,933 0,891 
X; Qualidade do produto 0,892 0,798 
X, Preço competitivo —0,730 0,661 

Total 
Soma de quadrados (autovalor) 2,589 2,216 1,846 1,406 8,057 
Percentual de traço 25,89 22,16 18,46 14,06 80,57 


iai: ue O, ã ii É variávei: ul É 
2 Cargas fatoriais menores que 0,40 não foram impressas, e as variáveis foram agrupadas por cargas em cada fator. 


possíveis incluem ignorar o cruzamento de cargas, elimi- 
nar X,, para evitar o cruzamento, usar outra técnica de ro- 
tação, ou diminuir o número de fatores. A discussão que 
se segue aborda essas opções e o curso de ação escolhido. 


Na solução fatorial rotacionada (Tabela 3-8), cada uma 
das variáveis tem cargas significantes (definidas como 
um valor acima de 0,40) sobre apenas um fator, exceto 
para X,, que cruza sobre dois fatores (1 e 4). Além disso, 
todas as cargas estão acima de 0,70, o que significa que 
mais da metade da variância é explicada pelas cargas em 
um só fator. Com todas as comunalidades de tamanho 
suficiente para garantir inclusão, a única decisão que fica 
é determinar a ação a ser tomada em X,,. 


O exame da matriz de correlação na Tabela 3-5 mostra 
que X,, tem elevadas correlações com X, (parte do fator 
4), X, (parte do fator 1) e X, (parte do fator 2). Logo, 
não surpreende que ela possa ter várias cargas elevadas. 
Com as cargas de 0,642 (fator 4) e 0,591 (fator 1) quase 


Etapa 4: Reespecifique o modelo fatorial, se neces- idênticas, o cruzamento de cargas é tão substancial que 
sário. Ainda que a matriz fatorial rotacionada tenha não pode ser ignorado. Quanto a empregar outra técnica 
melhorado a simplicidade das cargas fatoriais, as cargas de rotação, análise adicional mostrou que os outros mé- 


cruzadas de X,, nos fatores 1 e 4 exigem ação. As ações (Continua) 
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(Continuação) 
todos ortogonais (QUARTIMAX e EQUIMAX) ainda 
têm este problema fundamental. Além disso, o número 
de fatores não deve diminuir devido à variância explica- 
da relativamente grande (16,1%) para o quarto fator. 
Assim, o curso de ação a ser tomado é a eliminação 
de X,, da análise, deixando 10 variáveis. A matriz fato- 
rial rotacionada e outras informações para o conjunto 
reduzido de 10 variáveis são também exibidas na Tabela 
3-8. Como vemos, as cargas fatoriais para as 10 variáveis 
permanecem quase idênticas, exibindo o mesmo padrão 
e quase os mesmos valores para as cargas. A quantia de 
variância explicada aumenta ligeiramente para 80,6%. 
Com o padrão simplificado de cargas (todas em níveis 
significantes), todas as comunalidades acima de 50% (e 
a maioria muito maiores), e o nível geral de variância ex- 
plicada suficientemente alto, a solução com 10 variáveis 
e 4 fatores é aceita, com a etapa final sendo a descrição 
dos fatores. 


Etapa 5: Nomeação dos fatores. Quando uma solução 
fatorial satisfatória foi determinada, o pesquisador em 
seguida tenta atribuir algum significado aos fatores. O 
processo envolve substantiva interpretação do padrão de 
cargas fatoriais para as variáveis, incluindo seus sinais, em 
um esforço para nomear cada fator. Antes da interpreta- 
ção, um nível mínimo aceitável de significância para car- 
gas fatoriais deve ser selecionado. Em seguida, todas as 
cargas fatoriais significantes tipicamente são utilizadas no 
processo de interpretação. Variáveis com cargas maiores 
influenciam mais a seleção de nome ou rótulo para repre- 
sentar um fator. 


Examinemos os resultados na Tabela 3-8 para ilustrar 
esse procedimento. A solução fatorial foi determinada 
a partir da análise de componentes com uma rotação 
VARIMAX das 10 percepções da HBAT. O ponto de 
corte para fins de interpretação neste exemplo é todas 
as cargas de + (0,40 ou acima (ver Tabela 3-2). Esse é um 
ponto de corte relativamente baixo para ilustrar o pro- 
cesso de interpretação fatorial com tantas cargas signi- 
ficantes quanto possível. Contudo, em nosso exemplo, 
todas as cargas recaem bem acima ou abaixo dessa refe- 
rência, tornando a interpretação bastante direta. 

A interpretação substantiva é baseada nas cargas 
significantes. Na Tabela 3-8, cargas abaixo de 0,40 não 
foram impressas, e as variáveis são agrupadas por suas 
cargas sobre cada fator. Um padrão de variáveis com 
cargas elevadas para cada fator torna-se evidente. Os 
fatores 1 e 2 têm três variáveis com cargas significan- 
tes, e os fatores 3 e 4 têm duas. Cada fator pode ser 
nomeado com base nas variáveis com cargas signifi- 
cantes: 


1. Fator 1 Atendimento pós-venda: X, — soluções de re- 
clamação, X,, — velocidade de entrega e X,, — enco- 
menda e cobrança 

Fator 2 Marketing: X,, — imagem da equipe de venda, 
X, — presença de comércio eletrônico e X,, — anúncio 
Fator 3 Suporte técnico: X, — suporte técnico e X,, — 
garantia e reclamações 

Fator 4 Valor do produto: X, — qualidade do produto 
e X,, — preço competitivo 


2 


so 


> 


Uma questão em particular deve ser observada: No 
fator 4, preço competitivo (X,,) e qualidade do produ- 
to (X,) têm sinais opostos. Isso significa que qualidade 
de produto e preço competitivo variam juntos, mas se 
movem em sentidos opostos um em relação ao outro. 
Percepções são mais positivas se a qualidade do produto 
aumenta ou o preço cai. O balanço dessas duas situações 
opostas leva ao nome do fator, valor do produto. Quan- 
do variáveis têm sinais diferentes, o pesquisador precisa 
ser cuidadoso na compreensão das relações entre variá- 
veis antes de nomear os fatores e deve também executar 
ações especiais se calcular escalas múltiplas (ver discus- 
são anterior sobre escore reverso). 

Três variáveis (X,,, X,; e X,,) não foram incluídas na 
análise fatorial final. Quando as interpretações de car- 
gas fatoriais são apresentadas, deve ser observado que 
essas variáveis não foram incluídas. Se os resultados são 
usados em outras análises multivariadas, essas três pode- 
riam ser incluídas como variáveis separadas, apesar de 
não se poder garantir sua ortogonalidade em relação aos 
escores fatoriais. 


O processo de nomear fatores se baseia principalmen- 
te na opinião subjetiva do pesquisador. Em muitos casos, 
diferentes pesquisadores sem dúvida designarão diferen- 
tes nomes aos mesmos resultados por causa de diferenças 
em suas experiências e treinamento. Por esse motivo, o 
processo de nomear fatores está sujeito a consideráveis 
críticas. Se for possível designar um nome lógico que re- 
presente a natureza latente dos fatores, isso geralmente 
facilitará a apresentação e a compreensão da solução fato- 
rial e, portanto, tem-se um procedimento justificável. 


Aplicação de uma rotação oblíqua. A rotação VARI- 
MAX é ortogonal, o que significa que os fatores perma- 
necem sem correlação ao longo do processo de rotação. 
Mas em muitas situações, os fatores não precisam ser não- 
correlacionados e podem mesmo ser conceitualmente li- 
gados, o que exige correlação entre eles. O pesquisador 
deve sempre considerar a aplicação de um método de ro- 
tação não-ortogonal e avaliar sua comparabilidade com os 
resultados ortogonais. 


Em nosso exemplo, é muito razoável esperar que dimen- 


sões perceptuais sejam correlacionadas; assim, a aplica- 
(Continua) 
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(Continuação) 

ção de uma rotação oblíqua não-ortogonal é justificada. 
A Tabela 3-9 contém as matrizes padrão e de estrutura 
com as cargas fatoriais para cada variável em cada fator. 
Como discutido anteriormente, a matriz padrão geral- 
mente é usada para fins de interpretação, especialmente 
se os fatores têm uma substancial correlação entre os mes- 
mos. Nesse caso, a mais alta correlação entre os fatores é 
de apenas (0,241 (fatores 1 e 2), de forma que as matrizes 
padrão e de estrutura têm cargas bastante comparáveis. 
Examinando as variáveis com cargas altas em cada fator, 
notamos que a interpretação é exatamente a mesma en- 
contrada com a rotação VARIMAX. A única diferença é 
que todas as três cargas no fator 2 são negativas, de modo 
que se as variáveis estão reversamente codificadas, as cor- 
relações entre fatores reverterão sinais também. 


ramenta de redução de dados. Neste contexto, a análise 
fatorial ajudaria na redução do número de variáveis, pela 
seleção de um conjunto de variáveis substitutas, uma por 
fator, ou pela criação de novas variáveis compostas para 
cada fator. As seções seguintes detalham as questões so- 
bre redução de dados para este exemplo. 


Seleção de variáveis substitutas para análise subsegiien- 
te. Devemos primeiramente esclarecer o procedimento 
para seleção de variáveis substitutas. Ao selecionar uma 
única variável para representar um fator inteiro, é preferí- 
vel usar uma rotação ortogonal de modo a garantir que as 
variáveis selecionadas, tanto quanto possível, sejam não- 
correlacionadas umas com as outras. Assim, nessa análise, 
a solução ortogonal (Tabela 3-8) será usada no lugar dos 
resultados oblíquos. 


Estágio 6: Validação de análise fatorial 

A validação de qualquer resultado de análise fatorial é 
essencial, particularmente quando se tenta definir uma 
estrutura latente entre as variáveis. De um ponto de vis- 
ta ideal, sempre usaríamos após a análise fatorial alguma 
forma de análise fatorial confirmatória, como a modela- 
gem de equações estruturais (ver Capítulo 11), mas isso 
raramente é viável. Devemos olhar para outros meios, 
como análise de amostra repartida ou aplicação a amos- 
tras inteiramente novas. 


Neste exemplo, repartimos a amostra em duas amostras 
iguais de 50 respondentes e reestimamos os modelos fato- 
riais para testar por comparação. A Tabela 3-10 contém 
as rotações VARIMAX para os modelos de dois* fatores, 
junto com as comunalidades. Como pode ser visto, as duas 
rotações VARIMAX são bastante comparáveis em termos 
de cargas e comunalidades para todas as seis** percepções. 
A única ocorrência notável é a presença de um leve cru- 
zamento de cargas para X,, na subamostra 1, apesar de a 
grande diferença de cargas (0,445 versus -0,709) tornar a 
designação de X,, somente apropriada ao fator 4. 


Com isso, podemos ficar mais seguros de que os re- 
sultados são estáveis em nossa amostra. Se possível, sem- 
pre gostaríamos de realizar um trabalho extra, juntando 
respondentes adicionais e garantindo que os resultados se 
generalizem na população ou gerem novas subamostras 
para análise e avaliação de comparabilidade. 


Estágio 7: Usos adicionais dos 

resultados da análise fatorial 

O pesquisador tem a opção de usar a análise fatorial não 
apenas como uma ferramenta de resumo de dados, como 
visto na discussão anterior, mas também como uma fer- 


* N. de R. T.: A frase correta seria “para os modelos de quatro fatores”. 
** N. de R. T.: A frase correta seria “para todas as dez percepções”. 


Assumindo que queremos selecionar apenas uma variá- 
vel para uso posterior, a atenção estará na magnitude 
das cargas fatoriais (Tabela 3-8), independente do sinal 
(positivo ou negativo). Concentrando-nos nas cargas 
fatoriais dos fatores 1 e 3, percebemos que a primeira 
e a segunda carga, mais alta, são essencialmente idênti- 
cas (0,933 para X, e 0,931 para X,, no fator 1, 0,940 para 
Xs e 0,933 para X,, no fator 3). Se não temos qualquer 
evidência a priori para sugerir que a confiabilidade ou 
validade para uma das variáveis é melhor do que para 
a outra, e se nenhuma é teoricamente mais significativa 
para a interpretação do fator, selecionaríamos a variá- 
vel com a mais alta carga (X, e X, para os fatores 1 e 
3, respectivamente). No entanto, o pesquisador deve ser 
cauteloso para não permitir que essas medidas isoladas 
forneçam a única interpretação para o fator, pois cada 
fator é uma dimensão muito mais complexa do que po- 
deria ser representado em qualquer variável específica. 
A diferença entre a primeira e a segunda carga mais alta 
para os fatores 2 e 4 é muito maior, tornando a seleção 
das variáveis X,, (fator 2) e X, (fator 4) mais fácil e mais 
direta. Para todos os quatro fatores, porém, nenhuma 
variável única “representa” melhor a componente; as- 
sim, os escores fatoriais ou a escala múltipla seria(m) 
mais apropriada(os), se possível. 


Criação de escalas múltiplas. Uma escala múltipla é um 
valor composto para um conjunto de variáveis calculado 
por procedimentos simples, como a média das variáveis 
na escala. Isso é muito parecido com as variáveis estatís- 
ticas em outras técnicas multivariadas, exceto em que os 
pesos para cada variável são considerados iguais no pro- 
cedimento de cálculo de média. Desse modo, cada respon- 
dente teria quatro novas variáveis (escalas múltiplas para 
os fatores 1, 2, 3 e 4) que poderiam ser substitutas das 13 
variáveis originais em outras técnicas multivariadas. A 
análise fatorial ajuda na construção da escala múltipla pela 
identificação das dimensionalidades das variáveis (definin- 
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do os fatores), que formam então a base para os valores 
compostos se elas atendem certos critérios conceituais e 
empíricos. Após a efetiva construção das escalas múltiplas, 
o que inclui escores reversos de variáveis com sinais opos- 
tos (ver discussão anterior), as escalas devem também ser 
avaliadas quanto a confiabilidade e validade, se possível. 


Neste exemplo, a solução com quatro fatores sugere que 
quatro escalas múltiplas deveriam ser construídas. Os 
quatro fatores, discutidos anteriormente, correspondem 
a dimensões que podem ser nomeadas e relacionadas 
a conceitos com validade de conteúdo adequada. A di- 
mensionalidade de cada escala é sustentada pela inter- 
pretação limpa de cada fator, com cargas fatoriais altas 
de cada variável em apenas um fator. A confiabilidade 
das escalas múltiplas é melhor medida pelo alfa de Cron- 
bach, que nesse caso é 0,90 para a escala 1, 0,78 para a 
escala 2, 0,80 para a escala 3 e 0,57 para a escala 4. Ape- 
nas a escala 4, representando o fator Valor do Produto, 
tem confiabilidade abaixo do nível recomendado de 0,70. 
Ela será mantida para uso posterior com a advertência 
de ter uma confiabilidade menor e a necessidade de um 
futuro desenvolvimento de medidas adicionais para re- 
presentar tal conceito. 

Apesar de não haver qualquer teste direto para ava- 
liar a validade das escalas múltiplas na base de dados 
HBAT, uma abordagem é comparar as escalas múltiplas 
com as variáveis de substituição para ver se emergem 
padrões consistentes. A Tabela 3-11 ilustra o uso de es- 
calas múltiplas como substitutas das variáveis originais, 
comparando as diferenças nas variáveis de substituição 
ao longo das duas regiões (EUA/América do Norte ver- 
sus restante do mundo) de X, com aquelas diferenças 
das escalas múltiplas correspondentes. 

Quando vemos os dois grupos de X,, podemos per- 
ceber que o padrão de diferenças é consistente. X, e X, 
(as variáveis substitutas para os fatores 2 e 4) e as esca- 
las 2 e 4 (as escalas múltiplas para os fatores 2 e 4) têm 
todas diferenças significantes entre as duas regiões, en- 
quanto as medidas para o primeiro e o terceiro fator (X, 
e X, escalas 1 e 3, e escores fatoriais 1 e 3) não mostram 
diferenças. As escalas múltiplas e as variáveis substitutas 
mostram todas os mesmos padrões de diferenças entre 
as duas regiões, demonstrando algum nível de validade 
convergente entre essas duas medidas. 


Uso de escores fatoriais. Em vez de calcular escalas múl- 
tiplas, poderíamos calcular escores fatoriais para cada um 
dos quatro fatores em nossa análise de componentes. Os 
escores fatoriais diferem das escalas múltiplas no sentido 
de que os primeiros são diretamente baseados nas cargas 
fatoriais, o que significa que cada variável contribui para o 
escore fatorial com base no tamanho de sua carga (ao in- 
vés de calcular o escore de escala múltipla como a média 
de variáveis selecionadas com altas cargas). 


O primeiro teste de comparabilidade de escores fatoriais é 
semelhante àquele executado com escalas múltiplas na ava- 
liação do padrão de diferenças encontrado em X, para as 
variáveis substitutas e agora os escores fatoriais. Exatamen- 
te como visto nas escalas múltiplas, os padrões de diferenças 
foram idênticos, com diferenças sobre escores fatoriais 2 e 4 
correspondendo às diferenças nas variáveis substitutas para 
os fatores 2 e 4, sem diferenças para os demais. 

A consistência entre escores fatoriais e escalas múlti- 
plas é também vista nas correlações da Tabela 3-11. Sabe- 
mos que os escores fatoriais, uma vez rotacionados com 
uma técnica VARIMAX, são ortogonais (não-correlacio- 
nados). Mas quão próximas estão as escalas múltiplas dos 
escores fatoriais? A segunda parte da Tabela 3-11 exibe as 
correlações entre escalas múltiplas e escores fatoriais. A 
primeira parte da tabela mostra que as escalas são relativa- 
mente não-correlacionadas entre si (a mais alta correlação 
é de 0,260), o que se encaixa perfeitamente numa solução 
ortogonal. Esse padrão também combina com a solução 
oblíqua mostrada na Tabela 3-9 (note que o segundo fator 
na solução oblíqua tinha todas as cargas negativas, o que 
explica a diferença entre correlações positivas e negativas 
entre os fatores). Finalmente, a segunda matriz de corre- 
lação mostra um elevado grau de similaridade entre os 
escores fatoriais e os escores múltiplos, com correlações 
variando de 0,964 a 0,987. Esses resultados apóiam em se- 
guida o uso de escalas múltiplas como substitutos válidos 
para escores fatoriais se assim se quiser. 


Seleção do método de redução de dados. Se as variá- 
veis originais precisarem ser substituídas por variáveis 
substitutas, escores fatoriais ou escalas múltiplas, deve-se 
decidir qual usar. Essa decisão é baseada na necessidade 
de simplicidade (o que favorece as variáveis substitutas), 
repetição em outros estudos (o que favorece o uso de es- 
calas múltiplas) versus o desejo por ortogonalidade das 
medidas (o que favorece os escores fatoriais). Apesar de 
ser tentador o emprego de variáveis substitutas, a prefe- 
rência entre pesquisadores hoje em dia é o uso de esca- 
las múltiplas ou, em menor grau, escores fatoriais. De um 
ponto de vista empírico, as duas medidas compostas são 
essencialmente idênticas. As correlações na Tabela 3-11 
demonstram a elevada correspondência de escores fato- 
riais com escalas múltiplas e as baixas correlações entre as 
escalas múltiplas, aproximando-se da ortogonalidade dos 
escores fatoriais. No entanto, a decisão final fica com o 
pesquisador e a necessidade por ortogonalidade versus a 
repetitividade na seleção de escores fatoriais versus esca- 
las múltiplas. 


Análise de fatores comuns: estágios 4 e 5 


A análise de fatores comuns é o segundo modelo analíti- 
co fatorial mais importante que discutimos. A principal 
distinção entre a análise de componentes e a análise de 
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TABELA 3-9 Rotação oblíqua da matriz de análise fatorial de componentes 


MATRIZ PADRÃO 

CARGAS ROTACIONADAS OBLÍQUAS* 

Fator 

1 2 3 4 Comunalidade” 
X Solução de reclamação 0,943 0,890 
Xe Velocidade de entrega 0,942 0,894 
Xe Encomenda e cobrança 0,895 0,806 
X, Imagem da equipe de venda —0,897 0,860 
X, Comércio eletrônico —0,880 0,780 
Xo Anúncio —0,756 0,585 
X Suporte técnico 0,946 0,894 
X Garantia e reclamações 0,936 0,891 
X Qualidade do produto 0,921 0,798 
X, Preço competitivo —0,702 0,661 


MATRIZ DE ESTRUTURA 


CARGAS ROTACIONADAS OBLÍQUAS* 


Fator 
1 2 3 4 
X Solução de reclamação 0,943 
Xe Velocidade de entrega 0,942 
Xe Encomenda e cobrança 0,897 
X, Imagem da equipe de venda -0,919 
X, Comércio eletrônico -0,878 
Xo Anúncio —0,750 
X Suporte técnico 0,944 
X Garantia e reclamações 0,940 
X Qualidade do produto 0,884 
X,s Preço competitivo —0,773 
MATRIZ DE CORRELAÇÃO FATORIAL 
Fator 1 2 3 4 

1 1,000 

2 —0,241 1,000 

3 0,118 0,021 1,000 

4 0,121 0,190 0,165 1,000 


? Cargas fatoriais inferiores a 0,40 não foram impressas, e as variáveis foram agrupadas por suas cargas em cada fator. 
? Valores de comunalidade não são iguais à soma das cargas ao quadrado devido à correlação dos fatores. 


fatores comuns é que a última considera somente a va- 
riância comum associada a um conjunto de variáveis. Essa 
meta é alcançada fatorando-se uma matriz de correlação 
“reduzida” com comunalidades iniciais estimadas na dia- 
gonal em vez de unidades. As diferenças entre as análises 
de componentes e de fatores comuns ocorrem apenas nos 
estágios de estimação e interpretação de fatores (estágios 
4e 5). Após as comunalidades serem substituídas na dia- 
gonal, o modelo dos fatores comuns extrai fatores de um 
modo semelhante à análise de componentes. O pesquisa- 
dor usa os mesmos critérios para seleção e interpretação 
dos fatores. Para ilustrar as diferenças que podem ocorrer 


entre as análises de fatores comuns e de componentes, as 
seções seguintes detalham a extração e interpretação de 
uma análise de fatores comuns das 13 percepções HBAT 
usadas na análise de componentes. 


Estágio 4: Determinação de fatores 

e avaliação do ajuste geral 

A matriz de correlação reduzida com comunalidades na 
diagonal foi empregada na análise de fatores comuns. 
Lembrando os procedimentos empregados na análise de 
componentes, as 13 variáveis originais foram reduzidas a 
11 devido aos baixos valores MSA para X,,e X,,. 
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TABELA 3-10 Validação da análise fatorial de componentes por estimação de subamostras com rotação VARIMAX 


CARGAS ROTACIONADAS COM VARIMAX 


Fator 
Subamostra 1 1 2 3 4 Comunalidade 
X, Solução de reclamação 0,924 0,901 
Xe Velocidade de entrega 0,907 0,878 
Xe Encomenda e cobrança 0,901 0,841 
X, Imagem da equipe de venda 0,885 0,834 
X, Comércio eletrônico 0,834 0,733 
Xo Anúncio 0,812 0,668 
X; Suporte técnico 0,927 0,871 
X Garantia e reclamações 0,876 0,851 
X Qualidade do produto 0,884 0,813 
Xa Preço competitivo 0,445 —0,709 0,709 
CARGAS ROTACIONADAS COM VARIMAX 
Fator 
Subamostra 2 1 2 3 4 Comunalidade 
X Solução de reclamação 0,943 0,918 
Xe Velocidade de entrega 0,935 0,884 
Xe Encomenda e cobrança 0,876 0,807 
X,» Imagem da equipe de venda 0,902 0,886 
X, Comércio eletrônico 0,890 0,841 
Xo Anúncio 0,711 0,584 
X; Suporte técnico 0,958 0,932 
X,, Garantia e reclamações 0,951 0,916 
X Qualidade do produto 0,889 0,804 
X,3 Preço competitivo —0,720 0,699 


O primeiro passo é determinar o número de fatores a 
manter para exame e possível rotação. A Tabela 3-12 
mostra as estatísticas de extração. Se fôssemos empre- 
gar o critério da raiz latente com um valor de corte de 
1,0 para o autovalor, quatro fatores seriam mantidos. No 
entanto, a análise scree indica que cinco fatores devem 
ser mantidos (ver Figura 3-10). Ao combinar esses dois 
critérios, manteremos quatro fatores para análise poste- 
rior por causa do autovalor baixo do quinto fator e para 
manter a comparabilidade com a análise de componen- 
tes. Note que este mesmo conjunto de circunstâncias foi 
encontrado na análise de componentes. Como na análise 
de componentes examinada anteriormente, o pesquisa- 
dor deve empregar uma combinação de critérios para 
determinar o número de fatores a serem mantidos, e 
pode até mesmo querer examinar a solução de três fato- 
res como uma alternativa. 


Como o modelo final de fatores comuns às vezes difere 
das estimativas de extração iniciais (p.ex., ver a discussão 
da Tabela 3-12 que se segue), o pesquisador deve se asse- 
gurar de avaliar a estatística de extração para o modelo fi- 


nal de fatores comuns. Lembre que, em análise de fatores 
comuns, apenas a variância em “comum” ou compartilha- 
da é usada. Assim, o traço (soma de todos os autovalo- 
res) e os autovalores para todos os fatores serão menores 
quando apenas a variância comum é considerada. Como 
tal, um pesquisador pode querer ser mais liberal ao fa- 
zer julgamentos sobre questões como variância extraída 
ou o valor base do critério de raiz latente. Se o pesqui- 
sador estiver insatisfeito com a variância total explicada, 
por exemplo, as ações corretivas discutidas anteriormente 
ainda estão disponíveis (como a extração de um ou mais 
fatores para aumentar a variância explicada). Além disso, 
comunalidades também devem ser examinadas para ga- 
rantir que um nível adequado é mantido após a extração. 


Como também mostrado na Tabela 3-12, os autovalo- 
res para fatores extraídos podem ser reestabelecidos em 
termos do processo de extração de fator comum. Como 
exibido na Tabela 3-12, os valores para os fatores extraí- 
dos ainda suportam quatro fatores, pois o percentual de 
variância total explicada ainda é 70%. A única diferen- 
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TABELA 3-11 Avaliação da substituição das variáveis originais por escores fatoriais ou escalas múltiplas 


DIFERENÇA DE MÉDIA ENTRE GRUPOS DE RESPONDENTES COM BASE EM X, REGIÃO 


Teste estatístico Escores médios Teste-t 
Grupo 1: Grupo 2: 
Medida EUA/América do Norte Fora da América do Norte Valor t Significância 
Variáveis representativas de 
cada fator 
X, — Solução de reclamação 5,456 5,433 0,095 0,925 
X, — Imagem da equipe de 4,587 5,466 —4,341 0,000 
venda 
Xg — Suporte técnico 5,697 5,152 1,755 0,082 
X, — Qualidade do produto 8,705 7,238 5,951 0,000 
Escores fatoriais 
Fator 1 — Atendimento -0,081 0,019 —0,248 0,805 
Fator 2 — Marketing —0,308 0,197 —2,528 0,013 
Fator 3 — Suporte técnico 0,154 —0,098 1,234 0,220 
Fator 4 — Valor do produto 0,741 —0,474 7,343 0,000 
Escalas múltiplas 
Escala 1 — Atendimento 4,520 4,545 —0,140 0,889 
Escala 2 — Marketing 3,945 4,475 -3,293 0,001 
Escala 3 — Suporte técnico 5,946 5,549 1,747 0,084 
Escala 4 — Valor do produto 6,391 4,796 8,134 0,000 


Correlações entre escalas múltiplas 


Escala 1 Escala 2 Escala 3 Escala 4 
Escala 1 1,000 
Escala 2 0,260** 1,000 
Escala 3 0,113 0,010 1,000 
Escala 4 0,126 —0,225* 0,228* 1,000 


Correlações entre escores fatoriais e escalas múltiplas 


Fator 1 Fator 2 Fator 3 Fator 4 
Escala 1 0,987 0,127 0,057 0,060 
Escala 2 0,147 0,976 0,008 —0,093 
Escala 3 0,049 0,003 0,984** 0,096 
Escala 4 0,082 —0,150 0,148 0,964** 


* Significante no nível 0,05 
** Significante no nível 0,01 


TABELA 3-12 Resultados para a extração de fatores comuns: método de extração — fatoração do eixo principal 


Autovalores iniciais Extração de somas de cargas quadradas 
Percentual de Percentual Percentual de Percentual 
Fator Total variância cumulativo Total variância cumulativo 
1 3,427 31,154 31,154 3,215 29,231 29,231 
2 2,551 23,190 54,344 2,225 20,227 49,458 
3 1,691 15,373 69,717 1,499 13,630 63,088 
4 1,087 9,878 79,595 0,678 6,167 69,255 
5 0,609 5,540 85,135 
6 0,552 5,017 90,152 
7 0,402 3,650 93,802 
8 0,247 2,245 96,047 
9 0,204 1,850 97,898 
10 0,133 1,208 99,105 
11 0,098 0,895 100,000 
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(Continuação) 

ça substantiva é para o autovalor do fator 4, o qual fica 
abaixo do valor de referência de 1,0. No entanto, ele é 
mantido para esta análise devido ao fato de que o teste 
scree ainda suporta os quatro fatores e para manter com- 
parabilidade com a análise de componente. 

A matriz fatorial não-rotacionada (Tabela 3-13) 
mostra que as comunalidades de cada variável são com- 
paráveis âquelas encontradas na análise de componente. 
Como diversas variáveis estão abaixo de uma comuna- 
lidade de 0,50, um modelo de cinco fatores poderia ser 
construído em uma tentativa de aumentar as comunali- 
dades, bem como a variância geral explicada. Para nos- 
sos propósitos aqui, no entanto, interpretamos a solução 
de quatro fatores. 


Estágio 5: Interpretação dos fatores 
Com os fatores extraídos e o número de fatores finalizado, 
procedemos à interpretação dos fatores. 


Examinando as cargas não-rotacionadas (ver Tabela 
3-13), notamos a necessidade de uma rotação de matriz 
fatorial, exatamente como encontramos na análise de 
componentes. Cargas fatoriais não foram geralmente tão 
altas quanto se desejava, e duas variáveis (X, e X,,) exi- 
biram cargas cruzadas. Voltando então à matriz fatorial 
rotacionada VARIMAX para análise de fatores comuns 
(Tabela 3-14), a informação dada é a mesma fornecida 
na solução da análise de componentes (p.ex., somas de 
quadrados, percentuais de variância, comunalidades, so- 
mas totais de quadrados e variâncias totais extraídas). 
A comparação da informação fornecida na matriz 
fatorial rotacionada da análise de fatores comuns e da 
análise de componentes mostra uma similaridade im- 
pressionante. X,, tem cargas cruzadas substanciais nos 
fatores 1 e 4 em ambas as análises (Tabelas 3-8 e 3-14). 
Quando X,, é eliminada da análise, a solução em termos 
de quatro fatores é quase idêntica à análise de compo- 
nentes. As diferenças principais entre as duas análises 
são as cargas geralmente menores na análise de fatores 
comuns, devido principalmente às comunalidades me- 
nores das variáveis usadas na análise de fatores comuns. 
Entretanto, mesmo com essas pequenas diferenças nos 
padrões de cargas, as interpretações básicas são idênticas 
entre as análises de componentes e de fatores comuns. 


Uma visão gerencial dos resultados 


Tanto a análise de componentes quanto a de fatores co- 
muns fornecem ao pesquisador diversas idéias-chave sobre 
a estrutura das variáveis e opções para redução de dados. 
Primeiro, no que se refere à estrutura das variáveis, há ni- 
tidamente quatro dimensões distintas e separadas de ava- 
liação usadas pelos clientes da HBAT. Essas dimensões 
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FIGURA 3-10 Teste scree para análise de fatores comuns. 


englobam uma vasta gama de elementos na experiência 
do cliente, desde os atributos tangíveis do produto (Va- 
lor do Produto) até a relação com a firma (Atendimento 
e Suporte Técnico), e até mesmo esforços que vão além 
(Marketing) por parte da HBAT. Os administradores da 
HBAT agora podem discutir planos em torno dessas qua- 
tro áreas, em vez de lidar com as variáveis em separado. 

A análise fatorial também fornece a base para a re- 
dução de dados por meio de escalas múltiplas ou escores 
fatoriais. O pesquisador agora tem um método para com- 
binar as variáveis dentro de cada fator em um único es- 
core que pode substituir o conjunto original de variáveis 
por quatro novas variáveis compostas. Ao se procurar por 
diferenças, como entre regiões, essas novas variáveis com- 
postas podem ser usadas de modo que apenas diferenças 
para escores compostos sejam analisadas, ao invés de di- 
ferenças entre variáveis individuais. 


Resumo 


A técnica estatística multivariada de análise fatorial foi 
apresentada em amplos termos conceituais. Diretrizes 
básicas para interpretar os resultados foram incluídas 
para melhor esclarecer os conceitos metodológicos. Um 
exemplo de aplicação de análise fatorial foi apresentado, 
sustentado na base de dados HBAT. Este capítulo ajuda 
você a fazer o seguinte: 


Distinguir técnicas de análise fatorial de outras técnicas 
multivariadas. Análise fatorial exploratória (EFA) pode 
ser uma técnica estatística multivariada útil e poderosa 
para efetivamente extrair informação de grandes ban- 
cos de dados inter-relacionados. Quando variáveis estão 
correlacionadas, o pesquisador precisa de maneiras para 
gerenciar essas variáveis: agrupando variáveis altamente 
correlacionadas, rotulando ou nomeando os grupos, e tal- 
vez até criando uma nova medida composta que possa re- 
presentar cada grupo de variáveis. O objetivo principal da 
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TABELA 3-13 Matriz de cargas de fatores comuns não-rotacionada 
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Fator 
1 2 3 4 Comunalidade 
X,s Velocidade de entrega 0,895 0,942 
X, Solução de reclamação 0,862 0,843 
Xe, Encomenda e cobrança 0,747 0,622 
X, Linha de produto 0,689 —0,454 0,800 
X,> Imagem da equipe de venda 0,805 0,990 
X, Presença de comércio eletrônico 0,657 0,632 
X,3 Preço competitivo 0,553 0,443 
X,o Anúncio 0,457 0,313 
X, Suporte técnico 0,739 0,796 
X,, Garantia e reclamações 0,735 0,812 
X, Qualidade do produto —0,408 0,463 0,424 


* Cargas fatoriais inferiores a 0,40 não foram impressas, e as variáveis foram agrupadas por suas cargas em cada fator. 


análise fatorial exploratória é definir a estrutura latente 
entre as variáveis na análise. Como técnica de interdepen- 
dência, a análise fatorial tenta identificar agrupamentos 
entre variáveis (ou casos) com base em relações represen- 
tadas em uma matriz de correlações. É uma poderosa fer- 
ramenta para melhor compreender a estrutura dos dados, 
e também pode ser usada para simplificar análises de um 
grande conjunto de variáveis substituindo-as por variáveis 
compostas. Quando ela funciona bem, acaba apontando 
para relações interessantes que podem não ser óbvias a 
partir dos dados originais, ou mesmo a partir da matriz de 
correlação. 


Distinguir entre usos exploratório e confirmatório de téc- 
nicas de análise fatorial. A análise fatorial, como discu- 
tida neste capítulo, é principalmente uma técnica explo- 
ratória, uma vez que o pesquisador tem pouco controle 
sobre a especificação da estrutura (p.ex., número de fato- 
res, cargas de cada variável etc.). Apesar de os métodos 
discutidos neste capítulo fornecerem uma visão sobre os 
dados, qualquer tentativa de confirmação irá muito pro- 
vavelmente exigir o emprego de métodos específicos dis- 
cutidos nos capítulos sobre modelagem de equações es- 
truturais. 


Compreender os sete estágios da aplicação da análise fa- 
torial. Os sete estágios da aplicação da análise fatorial 
incluem o que se segue: 


1. Esclarecer os objetivos da análise fatorial. 

2. Planejar uma análise fatorial, incluindo a seleção de variá- 
veis e o tamanho da amostra. 

3. Suposições da análise fatorial. 

4. Obtenção de fatores e avaliação de ajuste geral, incluindo o 
modelo fatorial a ser usado e o número de fatores. 

5. Rotação e interpretação de fatores. 

6. Validação das soluções da análise fatorial. 

7. Usos adicionais de resultados fatoriais, como seleção de va- 
riáveis substitutas, criação de escalas múltiplas ou cálculo de 
escores fatoriais. 


Distinguir entre análise fatorial Re O. O principal uso 
da análise fatorial é desenvolver uma estrutura entre va- 
riáveis, chamada de análise fatorial R. A análise fatorial 
pode também ser empregada para agrupar casos, e é então 
chamada de análise fatorial Q. Ela é semelhante à análi- 
se de agrupamentos. A principal diferença é que análise 
fatorial Q usa correlação como medida de similaridade, 
enquanto análise de agrupamentos se baseia na medida 
de distância. 


Identificar as diferenças entre modelos de análise de com- 
ponentes e modelos de análise de fatores comuns. Três 
tipos de variância são considerados quando se aplica aná- 
lise fatorial: variância comum, variância única e variância 
de erro. Quando você acrescenta os três tipos de variân- 
cia, consegue assim a variância total. Cada um dos dois 
métodos de desenvolvimento de uma solução fatorial 
utiliza diferentes tipos de variância. Análise de compo- 
nentes, também conhecida como análise de componentes 
principais, considera a variância total e deriva fatores que 
contêm pequenas porções de variância única e, em alguns 
casos, variância de erro. A análise de componentes é pre- 
ferida quando a meta principal é a redução de dados. Aná- 
lise de fatores comuns se sustenta somente na variância 
comum (compartilhada) e assume que tanto a variância 
única quanto a de erro não são de interesse na definição 
da estrutura das variáveis. Ela é mais útil na identificação 
de construtos latentes e quando o pesquisador tem pouco 
conhecimento sobre a variância única e a de erro. Os dois 
métodos atingem essencialmente os mesmos resultados 
em muitas situações de pesquisa. 


Dizer como determinar o número de fatores a serem 
extraídos. Uma decisão crítica em análise fatorial é o 
número de fatores a serem mantidos para interpretação 
e uso posterior. Ao se decidir quando parar a fatoração 
(i.e., quanto fatores devem ser extraídos), o pesquisador 
deve combinar uma fundamentação conceitual (quantos 
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TABELA 3-14 Matriz das cargas de fatores comuns rotacionada por VARIMAX: conjuntos completo e reduzido de variáveis 


Fator? 

Conjunto completo de 11 variáveis 1 3 4 Comunalidade 
Xe Velocidade de entrega 0,949 0,942 
X Solução de reclamação 0,897 0,843 
Xe Encomenda e cobrança 0,768 0,622 
X, Imagem da equipe de venda 0,977 0,990 
X, Comércio eletrônico 0,784 0,632 
Xo Anúncio 0,529 0,313 
X Garantia e reclamações 0,884 0,812 
X; Suporte técnico 0,884 0,796 
X, Linha de produto 0,525 0,712 0,800 
X Qualidade do produto 0,647 0,424 
Xs Preço competitivo —0,590 0,443 

Total 
Soma de cargas quadradas 
(autovalor) 2,635 1,971 1,641 1,371 7,618 
Percentual de traço 23,95 17,92 14,92 12,47 69,25 

Fator? 

Conjunto reduzido de 10 variáveis 1 3 4 Comunalidade 
Xe Velocidade de entrega 0,925 0,885 
X Solução de reclamação 0,913 0,860 
Xe Encomenda e cobrança 0,793 0,660 
X, Imagem da equipe de venda 0,979 0,993 
X, Comércio eletrônico 0,782 0,631 
Xo Anúncio 0,531 0,316 
X; Suporte técnico 0,905 0,830 
X Garantia e reclamações 0,870 0,778 
X Qualidade do produto 0,788 0,627 
X Preço competitivo —0,480 0,353 

Total 
Soma de cargas quadradas 
(autovalor) 2,392 1,970 1,650 0,919 6,932 
Percentual de traço 23,92 19,70 16,50 9,19 69,32 


* Cargas fatoriais inferiores a 0,40 não foram impressas, e as variáveis foram agrupadas por suas cargas em cada fator. 


fatores devem estar na estrutura?) com alguma evidên- 
cia empírica (quantos fatores podem ser razoavelmente 
suportados?). O pesquisador geralmente começa com 
alguns critérios pré-determinados, como o número geral 
de fatores, somados a alguns valores gerais de referência 
com relevância prática (p.ex., percentual exigido de va- 
riância explicada). Esses critérios são combinados com 
medidas empíricas da estrutura fatorial. Uma base quan- 
titativa exata para decidir o número de fatores a serem 
extraídos ainda não foi desenvolvida. Critérios de para- 
da para o número de fatores a serem extraídos incluem 
a raiz latente ou autovalor, definição a priori, percentual 
de variância e teste scree. Esses critérios empíricos de- 
vem ser equilibrados com bases teóricas para estabelecer 
o número de fatores. 


Explicar o conceito de rotação de fatores. Talvez a fer- 
ramenta mais importante na interpretação de fatores seja 
a rotação fatorial. O termo rotação significa que os eixos 
de referência dos fatores giram em torno da origem até 
que outra posição tenha sido alcançada. Dois tipos de ro- 
tação são ortogonal e oblíquo. Soluções fatoriais não-ro- 
tacionadas extraem fatores na ordem de sua importância, 
com o primeiro fator sendo de caráter geral, com quase 
todas as variáveis carregando significativamente e expli- 
cando a maior quantia de variância. O segundo fator e os 
subsequentes são baseados na quantia residual de variân- 
cia, com cada um explicando sucessivamente porções cada 
vez menores de variância. O efeito final da rotação da ma- 
triz fatorial é redistribuir a variância dos primeiros fatores 
para os últimos, para conseguir um padrão mais simples 
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e teoricamente mais significativo. Rotação fatorial ajuda 
na interpretação dos fatores simplificando a estrutura por 
meio da maximização das cargas significantes de uma va- 
riável sobre um único fator. Dessa maneira, as variáveis 
mais úteis na definição do caráter de cada fator podem ser 
facilmente identificadas. 


Descrever como nomear um fator. Fatores representam 
uma composição de muitas variáveis. Quando foi obtida 
uma solução fatorial aceitável na qual todas as variáveis 
têm uma carga significante sobre um fator, o pesquisador 
tenta designar algum significado para o padrão de cargas 
fatoriais. Variáveis com cargas mais elevadas são consi- 
deradas mais importantes e têm maior influência sobre o 
nome ou rótulo selecionado para representar um fator. 
As variáveis significantes para um fator em particular são 
examinadas, e, colocando maior ênfase sobre aquelas va- 
riáveis com cargas mais altas, um nome ou rótulo é desig- 
nado a um fator que reflita precisamente as variáveis que 
carregam no mesmo. O pesquisador identifica as variáveis 
com a maior contribuição a um fator e designa um “nome” 
para representar o seu significado conceitual dele. 


Explicar os usos adicionais de análise fatorial. Depen- 
dendo dos objetivos para aplicar análise fatorial, o pes- 
quisador pode parar com a interpretação fatorial ou pros- 
seguir em um dos métodos para redução de dados. Se o 
objetivo é simplesmente identificar combinações lógicas 
de variáveis e melhor entender as relações entre variá- 
veis, então a interpretação fatorial bastará. Se o objeti- 
vo, porém, é identificar variáveis apropriadas para sub- 
sequente aplicação em outras técnicas estatísticas, então 
alguma forma de redução de dados será empregada. Uma 
das opções para redução de dados da análise fatorial é 
selecionar uma única variável (substituta) com a mais alta 
carga fatorial. Ao fazer isso, o pesquisador identifica uma 
única variável como a melhor representante para todas 
as variáveis no fator. Uma segunda opção para redução 
de dados é calcular uma escala múltipla, onde variáveis 
com as cargas fatoriais mais elevadas são somadas. Um 
escore múltiplo representa o fator, mas somente variáveis 
selecionadas contribuem para o escore composto. Uma 
terceira opção para redução de dados é calcular escores 
fatoriais para cada fator, onde cada variável contribui 
para o escore em sua carga fatorial. Essa medida única é 
uma variável composta que reflete as contribuições rela- 
tivas de todas as variáveis ao fator. Se a escala múltipla é 
válida e confiável, é provavelmente a melhor dessas três 
alternativas para redução de dados. 


Estabelecer as principais limitações das técnicas analíticas 
fatoriais. Três das limitações mais frequentemente cita- 
das são as seguintes: 


1. Como muitas técnicas para execução de análise fatorial ex- 
ploratória estão disponíveis, existe controvérsia sobre qual 
técnica é a melhor. 


2. Os aspectos subjetivos da análise fatorial (i.e., decidir 
quantos fatores devem ser extraídos, qual técnica deve ser 
empregada para rotacionar os eixos fatoriais, quais cargas 
fatoriais são significantes) estão todos sujeitos a muitas dife- 
renças de opinião. 

3. O problema da confiabilidade é real. 


Como qualquer outro procedimento estatístico, uma 
análise fatorial começa com um conjunto de dados im- 
perfeitos. Quando os dados variam por conta de mu- 
danças na amostra, do processo de coleta de dados ou 
de inúmeros tipos de erros de medida, os resultados da 
análise também podem se alterar. Os resultados de qual- 
quer análise são, portanto, menos do que perfeitamente 
dignos de confiança. 

As aplicações potenciais de análise fatorial explorató- 
ria na solução de problemas e na tomada de decisões em 
pesquisas de negócios são várias. A análise fatorial é um 
assunto muito mais complexo e complicado do que pode 
estar sugerido aqui. Esse problema é especialmente críti- 
co porque os resultados de uma solução analítica de um só 
fator freqiientemente parecem plausíveis. É importante 
enfatizar que plausibilidade não é garantia de validade ou 
estabilidade. 


Questões 


1. Quais são as diferenças entre os objetivos do resumo de da- 
dos e os da redução de dados? 

2. Como a análise fatorial pode ajudar o pesquisador a melho- 
rar os resultados de outras técnicas multivariadas? 

3. Quais orientações você pode usar para determinar o núme- 
ro de fatores a serem extraídos? Explique cada uma breve- 
mente. 

4. Como você usa a matriz de cargas fatoriais para interpretar 
o significado de fatores? 

5. Como e quando você deve usar escores fatoriais em conjun- 
ção com outras técnicas estatísticas multivariadas? 

6. Quais são as diferenças entre escores fatoriais e escalas múl- 
tiplas? Quando cada um deles é mais apropriado? 

7. Qual é a diferença entre a análise fatorial do tipo Q e a aná- 
lise de agrupamentos? 

8. Quando o pesquisador usa uma rotação oblíqua em vez de 
uma ortogonal? Quais são as diferenças básicas entre elas? 


Leituras sugeridas 


Uma lista de leituras sugeridas para ilustrar questões e 
aplicações da análise fatorial está disponível na Web em 
www.prenhall.com/hair (em inglês). 
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SEÇÃO 


Técnicas de Dependência 


VISÃO GERAL 


Enquanto o foco da Seção | foi a preparação de dados para 
a análise multivariada, a Seção Il lida com o que muitos cha- 
mariam de essência da análise multivariada, as técnicas de 
dependência. Como observado no Capítulo 1, as técnicas 
de dependência são baseadas no uso de um conjunto de 
variáveis independentes para prever e explicar uma ou mais 
variáveis dependentes. O pesquisador, diante de variáveis 
dependentes de uma natureza métrica ou não-métrica, tem 
à disposição diversos métodos de dependência para ajudá- 
lo no processo de relacionar variáveis independentes com 
dependentes. Dada a natureza multivariada desses méto- 
dos, todas as técnicas de dependência acomodam múlti- 
plas variáveis independentes e também permitem múltiplas 
variáveis dependentes em certas situações. Assim, o pes- 
quisador tem um conjunto de técnicas que devem viabilizar 
a análise de praticamente qualquer tipo de questão de pes- 
quisa que envolva uma relação de dependência. Elas tam- 
bém fornecem a oportunidade de se ter não apenas maior 
capacidade de previsão, mas uma explicação aprimorada 
da relação da variável dependente com as independentes. 
A explicação se torna cada vez mais importante à medida 
que as questões da pesquisa começam a abordar tópicos 
sobre como se dá a relação entre variáveis dependentes e 
independentes. 


CAPÍTULOS DA SEÇÃO Il 


A Seção Il cobre cinco técnicas de dependência: regressão 
múltipla, análise discriminante, regressão logística, análise 
multivariada de variância e análise conjunta, nos Capítulos 
4aY, respectivamente. As técnicas de dependência, como 
observado anteriormente, permitem ao pesquisador avaliar o 
grau de relação entre as variáveis dependentes e indepen- 
dentes. Tais técnicas variam no tipo e na característica da 


relação, como se reflete nas propriedades de medida das va- 
riáveis dependentes e independentes discutidas no Capítulo 
1. Por exemplo, a regressão múltipla e a análise discriminante 
acomodam múltiplas variáveis independentes métricas, mas 
variam de acordo com o tipo da variável dependente (análi- 
se de regressão — uma métrica e análise discriminante — uma 
não-métrica). O Capítulo 4, “Análise de Regressão Múltipla”, 
se concentra no que talvez seja a técnica multivariada mais 
fundamental e um construto para nossa discussão sobre os 
outros métodos de dependência. Seja para avaliar a confor- 
midade com as suposições estatísticas inerentes, para medir 
a precisão de previsão, ou para interpretar a variável estatís- 
tica de variáveis independentes, as questões discutidas no 
Capítulo 4 também serão vistas como cruciais em muitas das 
outras técnicas. O Capítulo 5, “Análise Discriminante Múltipla 
e Regressão Logística”, investiga uma forma única de rela- 
ção de dependência —- uma variável dependente que não é 
métrica. Nessa situação, o pesquisador tenta classificar as 
observações em grupos. Isso é possível por meio de análise 
discriminante ou regressão logística, uma variante da regres- 
são planejada para lidar especificamente com as variáveis 
dependentes não-métricas. No Capítulo 6, “Análise Multiva- 
riada de Variância”, a discussão difere das técnicas anteriores 
em diversos aspectos; ela é acomodada à análise de múlti- 
plas variáveis dependentes métricas e variáveis independen- 
tes não-métricas. Apesar de essa técnica ser uma extensão 
direta da análise simples de variância, as múltiplas variáveis 
dependentes métricas dificultam a previsão e a explicação. 
O Capítulo 7, “Análise Conjunta”, nos apresenta uma técnica 
diferente de qualquer outro método multivariado, em que o 
pesquisador determina os valores das variáveis não-métricas 
independentes de uma maneira quase experimental. Uma vez 
feito o planejamento, o respondente fornece informação rela- 
tiva apenas à variável dependente. Apesar de atribuir maior 
responsabilidade ao pesquisador, a análise conjunta fornece 
uma poderosa ferramenta para compreender processos com- 
plexos de decisão. 

Esta seção fornece ao pesquisador uma exposição de 
uma ampla série de técnicas de dependência disponíveis, 
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cada uma adequada a uma tarefa e uma relação específicas. 
Quando você completar esta seção, as questões relativas à 
seleção entre esses métodos serão visíveis e você se sentirá 
confortável na seleção dessas técnicas e na análise de seus 
resultados. 

Para leitores familiarizados com edições anteriores ou 
que procuram uma discussão sobre correlação canônica, 


indicamos o texto na Web (www.bookman.com.br). Aqui dis- 
cutimos a forma mais generalizada de análise multivariada, 
que acomoda múltiplas variáveis dependentes e indepen- 
dentes. Em situações nas quais variáveis estatísticas exis- 
tem para variáveis dependentes e independentes, a corre- 
lação canônica fornece um método flexível para previsão e 
explicação. 


CAPÍTULO 


Análise de Regressão Múltipla 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


= Determinar quando a análise de regressão é a ferramenta estatística adequada para analisar 
um problema. 

m Entender como a regressão nos ajuda a fazer previsões usando o conceito de mínimos 
quadrados 

Usar variáveis dicotômicas com uma compreensão de sua interpretação. 

Estar ciente das suposições inerentes à análise de regressão e como avaliá-las. 

Escolher uma técnica de estimação e explicar a diferença entre regressão stepwise e 
simultânea. 

nterpretar os resultados da regressão. 

Aplicar os procedimentos diagnósticos necessários para avaliar observações influentes. 


Apresentação do capítulo 


Este capítulo descreve a análise de regressão múltipla como é usada para resolver problemas de pes- 
quisa importantes, particularmente em negócios. A análise de regressão é de longe a técnica de de- 
pendência mais amplamente usada e versátil, aplicável em cada faceta da tomada de decisões em 
negócios. Seus usos variam desde os problemas mais gerais até os mais específicos, sendo que em 
cada caso relaciona um fator (ou fatores) a um resultado específico. Por exemplo, a análise de regres- 
são é o fundamento para os modelos de previsão em negócios, variando de modelos econométricos 
que prevêem a economia nacional com base em certas informações (níveis de renda, investimentos e 
assim por diante) até modelos de desempenho de uma empresa em um mercado se uma estratégia 
específica de marketing for adotada. Os modelos de regressão também são empregados para estudar 
como os consumidores tomam decisões ou formam impressões e atitudes. Outras aplicações incluem 
a avaliação de determinantes de efetividade de um programa (p.ex., quais fatores ajudam a manter a 
qualidade) e a determinação da viabilidade de um novo produto ou o retorno esperado de um novo 
empreendimento. Ainda que esses exemplos ilustrem apenas um pequeno subconjunto de todas as 
aplicações, eles demonstram que a análise de regressão é uma ferramenta analítica poderosa planeja- 
da para explorar todos os tipos de relações de dependência. 

A análise de regressão múltipla é uma técnica estatística geral usada para analisar a relação entre 
uma única variável dependente e diversas variáveis independentes. Como observado no Capítulo 1, 
sua formulação básica é 


VL=M+M+o+X, 


(métrica) (métricas) 


Este capítulo apresenta diretrizes para avaliar a adequação da regressão múltipla a vários tipos de 
problemas. São apresentadas sugestões para interpretar os resultados de sua aplicação de um ponto 
de vista gerencial e estatístico. Possíveis transformações dos dados para remediar violações de várias 
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suposições do modelo são examinadas, paralelamente com vários procedimentos diagnósticos que 
identificam observações com especial influência nos resultados. Leitores que já têm familiaridade com 
os procedimentos de regressão múltipla podem ignorar as partes iniciais do capítulo, mas para aqueles 
que conhecem menos o assunto ele fornece uma base valiosa para o estudo da análise multivariada 


de dados. 


Termos-chave 


Antes de começar este capítulo, leia os termos-chave para 
desenvolver uma compreensão dos conceitos e da terminolo- 
gia empregada. Ao longo do capítulo, os termos-chave apa- 
recem em negrito. Outros pontos que merecem destaque e 
termos-chave estão em itálico. Exemplos ilustrativos estão em 
quadros. 


Adição forward (ou inclusão em avanço) Método de seleção 
de variáveis para inclusão no modelo de regressão, que co- 
meça sem qualquer variável no modelo e então acrescenta 
variáveis com base em sua contribuição na previsão. 

Categoria de referência O nível omitido de uma variável não- 
métrica quando uma variável dicotômica é formada a partir da 
variável não-métrica. 

Codificação dos efeitos Método para especificar a categoria 
de referência para um conjunto de variáveis dicotômicas no 
qual a categoria de referência recebe um valor de —1 no con- 
junto de variáveis dicotômicas. Em nosso exemplo de codifi- 
cação de variável dicotômica para sexo, escolhemos que a 
variável é 1 ou O. Mas com codificação dos efeitos, o valor —1 
é usado no lugar de O. Com esse tipo de codificação, os coe- 
ficientes para as variáveis dicotômicas se tornam desvios de 
grupo da média da variável dependente em todos os grupos. 
Isso contrasta com a codificação indicadora, na qual a cate- 
goria de referência recebe o valor zero em todas as variáveis 
dicotômicas e os coeficientes representam desvios de grupo 
na variável dependente do grupo de referência. 

Codificação indicadora Método para especificar a categoria 
de referência para um conjunto de variáveis dicotômicas no 
qual a categoria de referência recebe um valor zero no con- 
junto de variáveis dicotômicas. Os coeficientes de repressão 
representam as diferenças de grupo na variável dependente 
em relação à categoria de referência. Ela difere da codifica- 
ção dos efeitos, na qual à categoria de referência é dado o 
valor —1 em todas as variáveis dicotômicas e os coeficientes 
de regressão representam desvios de grupo sobre a variável 
dependente em relação à média geral da mesma. 

Coeficiente ajustado de determinação (Rº ajustado) Medida 
modificada do coeficiente de determinação que considera o 
número de variáveis independentes incluídas na equação de 
regressão e o tamanho da amostra. Apesar de a adição de 
variáveis independentes sempre fazer com que o coeficiente 
de determinação aumente, o coeficiente ajustado de deter- 
minação pode cair se as variáveis independentes acrescen- 
tadas tiverem pouco poder de explicação e/ou se os graus 
de liberdade se tornarem muito pequenos. Essa estatística é 
muito útil para comparação entre equações com diferentes 


números de variáveis independentes, diferentes tamanhos de 
amostras, ou ambos. 

Coeficiente beta Coeficiente de regressão padronizado (ver 
padronização) que permite uma comparação direta entre 
coeficientes quanto a seus poderes relativos de explicação 
da variável dependente. Ao contrário dos coeficientes de re- 
gressão, que são expressos em termos das unidades da va- 
riável associada, o que torna as comparações inadequadas, 
os coeficientes beta usam dados padronizados e podem ser 
comparados diretamente. 

Coeficiente de correlação (r) Coeficiente que indica a força da 
associação entre quaisquer duas variáveis métricas. O sinal 
(+ ou —) indica a direção da relação. O valor pode variar de 
—1 a +1, onde +1 indica uma perfeita relação positiva, O in- 
dica relação nenhuma, e —1, uma perfeita relação negativa 
ou reversa (quando uma variável se torna maior, a outra fica 
menor). 

Coeficiente de correlação parcial Valor que mede a força da 
relação entre a variável dependente ou critério e uma única 
variável independente quando os efeitos das demais variá- 
veis independentes no modelo são mantidos constantes. Por 
exemplo, rY,X,,X, mede a variação em Y associada a X, quan- 
do o efeito de X, em X,e Y é mantido constante. Esse valor 
é usado em métodos de estimação de modelo de regressão 
com seleção sequencial de variáveis (p. ex., stepwise, adi- 
ção forward ou eliminação backward) para identificar a va- 
riável independente com o maior poder preditivo incremental 
além das variáveis independentes já presentes no modelo de 
regressão. 

Coeficiente de determinação (R?) Medida da proporção da va- 
riância da variável dependente em torno de sua média que 
é explicada pelas variáveis independentes ou preditoras. O 
coeficiente pode variar entre O e 1. Se o modelo de regres- 
são é propriamente aplicado e estimado, o pesquisador pode 
assumir que quanto maior o valor de FÊ, maior o poder de 
explicação da equação de regressão e, portanto, melhor a 
previsão da variável dependente. 

Coeficiente de regressão (b,) Valor numérico da estimativa 
do parâmetro diretamente associado com uma variável in- 
dependente; por exemplo, no modelo Y = b, + b,X,, o valor 
b, é o coeficiente de regressão para a variável X,. O coefi- 
ciente de regressão representa o montante de variação na 
variável dependente em relação a uma unidade de variação 
na variável independente. No modelo preditor múltiplo (por 
exemplo, Y = by + DX, + b,X;), os coeficientes de regres- 
são são coeficientes parciais, pois cada um considera não 
apenas as relações entre Ye X,e entre Ye X,, mas também 
entre X,e X,. O coeficiente não é limitado nos valores, já que 


CAPÍTULO 4 Análise de Regressão Múltipla 151 


é baseado tanto no grau de associação quanto nas unida- 
des de escala da variável independente. Por exemplo, duas 
variáveis com a mesma associação a Y teriam coeficientes 
diferentes se uma variável independente fosse medida em 
uma escala de 7 pontos e outra fosse baseada em uma es- 
cala de 100 pontos. 

Colinearidade Expressão da relação entre duas (colinearida- 
de) ou mais (multicolinearidade) variáveis independentes. 
Diz-se que duas variáveis independentes exibem colineari- 
dade completa se seu coeficiente de correlação é 1, e com- 
pleta falta de colinearidade se o coeficiente de correlação 
é O. A multicolinearidade ocorre quando qualquer variável 
independente é altamente correlacionada com um conjun- 
to de outras variáveis independentes. Um caso extremo de 
colinearidade/multicolinearidade é a singularidade, na qual 
uma variável independente é perfeitamente prevista (ou seja, 
correlação de 1,0) por uma outra variável independente (ou 
mais de uma). 

Correlação parcial Valor que mede a força da relação entre 
uma variável dependente e uma única variável independente 
quando os efeitos preditivos das demais variáveis indepen- 
dentes no modelo de regressão são removidos. O objetivo é 
retratar o efeito preditivo único devido a uma só variável inde- 
pendente em um conjunto de variáveis independentes. Difere 
do coeficiente de correlação parcial, que envolve efeito pre- 
ditivo incremental. 

Correlação semiparcial Ver coeficiente de correlação parcial. 

Efeito de supressão O caso no qual as relações esperadas 
entre variáveis independentes e dependentes são ocultas ou 
suprimidas quando vistas em uma relação bivariada. Quando 
variáveis independentes adicionais são introduzidas, a multi- 
colinearidade remove a variância compartilhada “indesejável” 
e revela a “verdadeira” relação. 

Efeito moderador Efeito no qual uma terceira variável indepen- 
dente (a variável moderadora) faz com que a relação entre 
um par de variáveis dependente/independente mude, depen- 
dendo do valor da variável moderadora. Também é conhecido 
como um efeito interativo e semelhante ao efeito de interação 
visto em métodos de análise de variância. 

Eliminação backward (ou eliminação retroativa) Método de 
seleção de variáveis para inclusão no modelo de regressão 
que começa incluindo todas as variáveis independentes no 
modelo e então elimina as que não oferecem uma contribui- 
ção significativa para a previsão. 

Erro de amostra A variação esperada em qualquer parâmetro 
estimado (intercepto ou coeficiente de regressão) que é devi- 
do ao uso de uma amostra no lugar da população. O erro de 
amostra é reduzido quando a amostra é aumentada e usada 
para testar estatisticamente se o parâmetro estimado difere 
de zero. 

Erro de especificação Erro na previsão da variável dependente 
causado pela exclusão de uma ou mais variáveis indepen- 
dentes relevantes. Essa omissão pode distorcer os coeficien- 
tes estimados das variáveis incluídas, bem como diminuir o 
poder preditivo geral do modelo de regressão. 


Erro de medida Grau em que os valores dos dados não medem 


verdadeiramente a característica representada pela variável. 
Por exemplo, quando se questiona sobre a renda familiar to- 
tal, há muitas fontes de erro de medida (p, ex., relutância em 
responder a quantia total e erro na estimativa da renda total) 
que tornam os valores imprecisos. 


Erro de previsão Diferença entre os valores reais e os previstos 


da variável dependente, para cada observação na amostra 
(ver resíduo). 


Erro padrão Distribuição esperada de um coeficiente de re- 


gressão estimado. O erro padrão é semelhante ao desvio- 
padrão de qualquer conjunto de dados, mas denota a am- 
plitude esperada do coeficiente em múltiplas amostras dos 
dados. É útil em testes estatísticos de significância que tes- 
tam se o coeficiente é significantemente diferente de zero 
(ou seja, se a amplitude esperada do coeficiente contém* o 
valor de zero em um dado nível de confiança). O valor t de 
um coeficiente de regressão é o coeficiente dividido por seu 
erro padrão. 


Erro padrão da estimativa (SE,) Medida da variação nos valo- 


res previstos que pode ser usada para desenvolver intervalos 
de confiança em torno de qualquer valor previsto. É análogo 
ao desvio-padrão de uma variável em torno de sua média, 
mas se trata da distribuição esperada de valores previstos 
que ocorreriam se fossem tomadas múltiplas amostras dos 
dados. 


Estatística PRESS Medida de validação obtida eliminando-se 


cada observação, uma por vez, e prevendo-se esse valor de- 
pendente com o modelo de regressão estimado a partir das 
demais observações. 


Estimação stepwise Método de seleção de variáveis para in- 


clusão no modelo de regressão que começa selecionando o 
melhor preditor da variável dependente. Variáveis indepen- 
dentes adicionais são selecionadas em termos do poder ex- 
plicativo incremental que podem acrescentar ao modelo de 
regressão. Variáveis independentes são acrescentadas des- 
de que seus coeficientes de correlação parcial sejam estatis- 
ticamente significantes. Variáveis independentes também po- 
dem ser eliminadas se seu poder preditivo cair para um nível 
não significante quando uma outra variável independente for 
acrescentada ao modelo. 


Fator de inflação de variância (VIF) | Indicador do efeito que as 


outras variáveis independentes têm sobre o erro padrão de 
um coeficiente de regressão. O fator de inflação de variância 
está diretamente** relacionado ao valor de tolerância (VIF, = 
1/TOL). Valores VIF altos também indicam um alto grau de 
colinearidade ou multicolinearidade entre as variáveis inde- 
pendentes. 


Gráfico de probabilidade normal Comparação gráfica da for- 


ma da distribuição da amostra em relação à distribuição nor- 
mal. No gráfico, a distribuição normal é representada por uma 
reta com inclinação de 45 graus. A verdadeira distribuição é 


*N. de R.T.: Afrase correta seria “não contém o valor de zero”. 


* N. de R.T.: A frase correta seria “inversamente relacionado”. 
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representada em contraste com essa reta, de modo que qual- 
quer diferença é mostrada como desvio da reta, tornando a 
identificação de diferenças bastante simples. 


Gráfico de regressão parcial Representação gráfica da rela- 


ção entre a variável dependente e uma única variável inde- 
pendente. O diagrama de dispersão de pontos representa 
a correlação parcial entre as duas variáveis, com os efeitos 
de outras variáveis independentes mantidos constantes 
(ver coeficiente de correlação parcial). Essa representação 
é particularmente útil na avaliação da forma da relação (li- 
near versus não-linear) e na identificação de observações 
influentes. 


Gráfico nulo Gráfico de resíduos versus valores previstos que 


exibe um padrão aleatório. Um gráfico nulo é indicativo da 
ausência de violações identificáveis das suposições inerentes 
à análise de regressão. 


Graus de liberdade (df, degrees of freedom) Valor calculado 


a partir do número total de observações menos o número de 
parâmetros estimados. Essas estimativas de parâmetros são 
restrições sobre os dados porque, uma vez calculadas, elas 
definem a população da qual se supõe que os dados tenham 
sido obtidos. Por exemplo, ao estimar um modelo de regres- 
são com uma única variável independente, estimamos dois 
parâmetros, o intercepto (b,) e um coeficiente de regressão 
para a variável independente (b,). Ao estimar o erro aleatório, 
definido como a soma dos erros de previsão (valores depen- 
dentes reais menos os previstos) para todos os casos, encon- 
trarfamos (n — 2) graus de liberdade. Os graus de liberdade 
nos dão uma medida de quão restritos estão os dados para 
alcançar um certo nível de previsão. Se o número de graus de 
liberdade é pequeno, a previsão resultante pode ser menos 
generalizável porque todas, exceto algumas observações, 
foram incorporadas na previsão. Reciprocamente, um valor 
alto no número de graus de liberdade indica que a previsão é 
bastante “robusta”, no sentido de ser representativa de toda a 
amostra de respondentes. 


cio for eliminado. Contudo, em muitos casos, a constante tem 
apenas valor preditivo, porque não há situação na qual todas 
as variáveis independentes estejam ausentes. Um exemplo é 
prever a preferência sobre um produto com base em atitudes 
de consumidores. Todos os indivíduos têm algum nível de ati- 
tude, e assim o intercepto não tem uso gerencial, mas ainda 
auxilia na previsão. 


Linearidade Termo usado para expressar o conceito de que o 


modelo possui as propriedades de aditividade e homogenei- 
dade. Em um sentido simples, os modelos lineares prevêem 
valores que estão sobre uma reta que tem uma taxa constante 
de variação (coeficiente angular) da variável dependente em 
relação a uma variação unitária constante na variável inde- 
pendente. No modelo populacional Y = b, + DX, + e, o efeito 
de uma variação de 1,0 em X, será o acréscimo de b, (uma 
constante) unidades em Y, 


Mínimos quadrados Procedimento de estimação usado em 


regressão simples e múltipla no qual os coeficientes de re- 
gressão são estimados de modo a minimizar a soma total dos 
quadrados dos resíduos. 


Multicolinearidade Ver colinearidade 
Nível de significância (alfa) Frequentemente chamado de nível 


de significância estatística, o nível de significância representa 
a probabilidade que o pesquisador deseja aceitar de que o 
coeficiente estimado seja classificado como diferente de zero 
quando realmente não é. É também chamado de erro Tipo |. 
O nível de significância mais amplamente usado é 0,05, ape- 
sar de pesquisadores utilizarem níveis que variam de 0,01 
(mais exigentes) até 0,10 (menos conservador e mais fácil de 
descobrir significância). 


Observação atípica Em termos estritos, uma observação que 


tem uma diferença substancial entre o valor real para a variá- 
vel dependente e o valor previsto. Casos que são substancial- 
mente diferentes, em relação às variáveis dependentes ou às 
independentes, também são chamados de atípicos. Em todos 
os casos, o objetivo é identificar as observações que são re- 


Heteroscedasticidade Ver homocedasticidade. 

Homocedasticidade Descrição de dados para os quais a va- 
riância dos termos de erro (e) aparece constante no interva- 
lo de valores de uma variável independente. A suposição de 


presentações inadequadas da população da qual a amostra 

é obtida, de forma que elas podem ser ignoradas ou mesmo 

eliminadas da análise como não-representativas. 
Observação influente (ou ponto influente) Uma observação 


igual variância do erro da população £ (onde e é estimado a 
partir do valor amostral e) é essencial à aplicação adequada 
de regressão linear. Quando os termos de erro têm variância 
crescente ou flutuante, diz-se que os dados são heterosce- 
dásticos. A discussão de resíduos neste capítulo ilustra me- 
lhor essa questão. 


Intercepto (b,) Valor no eixo Y (eixo da variável dependente) 


onde a reta definida pela equação de regressão Y = by+ DX, 
cruza o eixo. É descrito pelo termo constante by na equação 
de regressão. Além de seu papel na previsão, o intercepto 
pode ter uma interpretação gerencial. Se a completa ausência 
da variável independente tem significado, então o intercepto 
representa essa quantia. Por exemplo, quando se estimam 
vendas a partir de investimentos ocorridos com anúncios, o 
intercepto representa o nível de vendas esperadas se o anún- 


que exerce uma influência desproporcional sobre um ou mais 
aspectos das estimativas de regressão. Essa influência pode 
ser baseada em valores extremos das variáveis independen- 
tes ou da dependente, ou ambas. As observações influentes 
podem ser “boas”, reforçando o padrão dos demais dados, 
ou “ruins”, quando um único caso ou um pequeno conjunto de 
casos afeta excessivamente as estimativas. Não é necessário 
que a observação seja atípica, apesar de que muitas vezes 
observações atípicas também podem ser classificadas como 
influentes. 


Padronização Processo no qual a variável original é trans- 


formada em uma nova variável com uma média de O e um 
desvio-padrão de 1. O procedimento típico é primeiramente 
subtrair a média da variável do valor de cada observação e 
então dividir pelo desvio-padrão. Quando todas as variáveis 


CAPÍTULO 4 Análise de Regressão Múltipla 153 


de uma variável estatística de regressão estão padronizadas, 
o termo b, (o intercepto) assume um valor O e os coeficien- 
tes de regressão são conhecidos como coeficientes beta, 
os quais permitem ao pesquisador comparar diretamente o 
efeito relativo de cada variável independente sobre a variável 
dependente. 

Parâmetro Quantidade (medida) característica da população. 
Por exemplo, Le o” são os símbolos usados para os parâme- 
tros populacionais de média (1) e variância (6”). Estes normal- 
mente são estimados a partir dos dados da amostra em que 
a média aritmética da amostra é utilizada como uma medida 
da média populacional e a variância da amostra é empregada 
para estimar a variância da população. 

Poder Probabilidade de uma relação significante ser encontra- 
da se ela realmente existir. Complementa o nível de significân- 
cia alfa (o), mais amplamente usado. 

Polinômio Transformação de uma variável independente para 
representar uma relação curvilínea com a variável dependen- 
te. Incluindo-se um termo quadrado (X?), um único ponto de 
inflexão é estimado. Um termo cúbico estima um segundo 
ponto de inflexão. Termos adicionais de potência superior 
também podem ser estimados. 

Pontos de alavanca Tipo de observação influente definido por 
um aspecto da influência chamado de alavanca. Essas ob- 
servações são substancialmente diferentes em uma ou mais 
variáveis independentes, de modo que afetam a estimação 
de um ou mais coeficientes de regressão. 

Regressão com todos os subconjuntos possíveis Método 
para selecionar as variáveis para inclusão no modelo de re- 
gressão que considera todas as combinações possíveis das 
variáveis independentes. Por exemplo, se o pesquisador 
especifica quatro variáveis independentes potenciais, essa 
técnica estima todos os possíveis modelos de regressão com 
uma, duas, três e quatro variáveis. Então, a técnica identifica 
o(s) modelo(s) com melhor precisão de previsão. 

Regressão múltipla Modelo de regressão com duas ou mais 
variáveis independentes. 

Regressão simples Modelo de regressão com uma única va- 
riável independente, também conhecido como regressão bi- 
variada. 

Relação estatística Relação baseada na correlação de uma ou 
mais variáveis independentes com a variável dependente. 
Medidas de associação, tipicamente correlações, represen- 
tam o grau de relação porque há mais de um valor da variável 
dependente para cada valor da variável independente. 

Resíduo (e ou£) Erro na previsão de nossos dados da amostra. 
Raramente nossas previsões serão perfeitas. Consideramos 
que o erro aleatório ocorrerá, mas assumimos que esse erro é 
uma estimativa do verdadeiro erro aleatório na população (£), 
não apenas o erro na previsão de nossa amostra (e). Consi- 
deramos que o erro na população que estamos estimando é 
distribuído com uma média de O e uma variância constante 
(homoscedástica). 

Resíduo estudantizado A forma mais comumente usada de 
resíduo padronizado. Difere de outros métodos na manei- 


ra como calcula o desvio-padrão usado em padronização. 
Para minimizar o efeito de qualquer observação no processo 
de padronização, o desvio-padrão residual para a obser- 
vação | é computado a partir de estimativas de regressão, 
omitindo-se a iésima observação no cálculo das estimativas 
de regressão. 

Singularidade O caso extremo de colinearidade ou multicoline- 
aridade no qual uma variável independente é perfeitamente 
prevista (uma correlação de + 1,0) por uma ou mais variáveis 
independentes. Modelos de regressão não podem ser estima- 
dos quando existe uma singularidade. O pesquisador deve 
omitir uma ou mais das variáveis independentes envolvidas 
para remover a singularidade. 

Soma de quadrados da regressão (SS,) Soma das diferenças 
quadradas entre a média e valores previstos da variável de- 
pendente para todas as observações. Representa a quantia 
de melhoramento na explicação da variável dependente atri- 
buível à(s) variável(eis) independente(s). 

Soma de quadrados dos erros (SS,) Soma dos erros de previ- 
são (resíduos) ao quadrado em todas as observações. É usa- 
da para denotar a variância na variável dependente ainda não 
explicada pelo modelo de regressão. Se nenhuma variável 
independente é empregada para previsão, ela se transforma 
nos quadrados dos erros, usando a média como o valor pre- 
visto, e assim se iguala à soma total de quadrados. 

Soma total de quadrados (SS,) Quantia total de variação exis- 
tente a ser explicada pelas variáveis independentes. Esse 
ponto de referência é calculado somando-se as diferenças 
quadradas entre a média e valores reais para a variável de- 
pendente em todas as observações. 

Tolerância Medida de colinearidade e multicolinearidade co- 
mumente usada. A tolerância da variável | (TOL) é 1 — R7i, 
onde Rº ié o coeficiente de determinação para a previsão da 
variável | pelas outras variáveis independentes na variável es- 
tatística de regressão. À medida que o valor da tolerância se 
torna menor, a variável é melhor prevista pelas outras variá- 
veis independentes (colinearidade). 

Transformação Uma variável pode ter uma característica inde- 
sejável, como não-normalidade, que diminui a habilidade do 
coeficiente de correlação de representar a relação entre ela 
e outra variável. Uma transformação como calcular o logarit- 
mo ou a raiz quadrada da variável cria uma nova variável e 
elimina a característica indesejável, permitindo uma medida 
melhor da relação. Transformações podem ser aplicadas em 
variáveis dependentes, independentes, ou ambas. A neces- 
sidade e o tipo específico de transformação podem ser ba- 
seados em motivos teóricos (como a transformação de uma 
relação não-linear conhecida) ou empíricos (identificados por 
meios gráficos ou estatísticos). 

Valores parciais F (ou t) O teste parcial F é simplesmente um 
teste estatístico da contribuição adicional de uma variável 
para a precisão de previsão acima da contribuição das variá- 
veis já na equação. Quando uma variável (X,) é acrescentada 
a uma equação de regressão depois que outras variáveis já 
estão na equação, sua contribuição pode ser muito pequena, 
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ainda que tenha uma alta correlação com a variável depen- 
dente. O motivo é que X, é altamente correlacionada com as 
variáveis já na equação. O valor parcial F é calculado para 
todas as variáveis simplesmente simulando que cada uma, 
por sua vez, seja a última a entrar na equação. Ele fornece a 
contribuição adicional de cada variável acima de todas as ou- 
tras na equação. Um valor parcial F pequeno ou insignificante 
para uma variável que não está presente na equação indica 
sua contribuição pequena ou insignificante ao modelo como 
já especificado. Um valor t pode ser calculado no lugar de va- 
lores F em todos os casos, sendo o valor t aproximadamente 
a raiz quadrada do valor F. 

Variável critério (Y) Ver variável dependente. 

Variável dependente (Y) Variável que está sendo prevista ou 
explicada pelo conjunto de variáveis independentes. 

Variável dicotômica Variável independente usada para explicar 
o efeito que diferentes níveis de uma variável não-métrica têm 
na previsão da variável dependente. Para explicar L níveis de 
uma variável independente não-métrica, L — 1 variáveis dico- 
tômicas são necessárias. Por exemplo, o sexo é medido como 
masculino ou feminino e poderia ser representado por duas 
variáveis dicotômicas, X, e X,. Quando o respondente é do 
sexo masculino, X, = 1 e X,= 0. Do mesmo modo, quando o 
respondente é do sexo feminino, X, = 0 e X,= 1. No entanto, 
quando X, = 1, sabemos que X, deve ser igual a O. Assim, pre- 
cisamos de apenas uma variável, X, ou X,, para representar o 
sexo. Não precisamos incluir ambas, pois uma é perfeitamen- 
te prevista pela outra (uma singularidade) e os coeficientes de 
regressão não podem ser estimados. Se uma variável tem três 
níveis, apenas duas variáveis dicotômicas são necessárias. 
Assim, o número de variáveis dicotômicas é um a menos do 
que o número de níveis da variável não-métrica. Os dois mé- 
todos mais comuns para determinação dos valores das variá- 
veis dicotômicas são a codificação indicadora e a codificação 
dos efeitos. 

Variável estatística de regressão Combinação linear de variá- 
veis independentes ponderadas usadas coletivamente para 
prever a variável dependente. 

Variável independente Variável(is) selecionada(s) como previ- 
soras e potenciais variáveis de explicação da variável depen- 
dente. 


Variável preditora (X,) Ver variável independente. 


O QUE É ANÁLISE DE 
REGRESSÃO MÚLTIPLA? 


A análise de regressão múltipla é uma técnica estatísti- 
ca que pode ser usada para analisar a relação entre uma 
única variável dependente (critério) e várias variáveis 
independentes (preditoras). O objetivo da análise de re- 
gressão múltipla é usar as variáveis independentes cujos 
valores são conhecidos para prever os valores da variável 
dependente selecionada pelo pesquisador. Cada variável 
independente é ponderada pelo procedimento da análise 
de regressão para garantir máxima previsão a partir do 


conjunto de variáveis independentes. Os pesos denotam 
a contribuição relativa das variáveis independentes para 
a previsão geral e facilitam a interpretação sobre a in- 
fluência de cada variável em fazer a previsão, apesar de a 
correlação entre as variáveis independentes complicar o 
processo interpretativo. O conjunto de variáveis indepen- 
dentes ponderadas forma a variável estatística de regres- 
são, uma combinação linear das variáveis independentes 
que melhor prevê a variável dependente (o Capítulo 1 
contém uma explicação mais detalhada da variável estatís- 
tica). A variável estatística de regressão, também conhe- 
cida como equação de regressão ou modelo de regressão, 
é o exemplo mais amplamente conhecido de uma variável 
estatística entre as técnicas multivariadas. 

Como observado no Capítulo 1, a análise de regressão 
múltipla é uma técnica de dependência. Assim, para usá- 
la, você deve ser capaz de classificar as variáveis em depen- 
dentes e independentes. A análise de regressão também 
é uma ferramenta estatística que deveria ser empregada 
apenas quando variáveis dependente e independentes são 
métricas. Porém, sob certas circunstâncias, é possível in- 
cluir dados não-métricos como variáveis independentes 
(transformando dados ordinais ou nominais com codifica- 
ção dicotômica) ou como a variável dependente (pelo uso 
de uma medida binária na técnica especializada de regres- 
são logística; ver Capítulo 5). Em resumo, para aplicar a 
análise de regressão múltipla, (1) os dados devem ser mé- 
tricos ou adequadamente transformados, e, (2) antes de 
estabelecer a equação de regressão, o pesquisador deve 
decidir qual variável deve ser dependente e quais serão as 
independentes. 


UM EXEMPLO DE REGRESSÃO 
SIMPLES E MULTIPLA 


O objetivo da análise de regressão é prever uma única va- 
riável dependente a partir do conhecimento de uma ou 
mais variáveis independentes. Quando o problema envol- 
ve uma única variável independente, a técnica estatísti- 
ca é chamada de regressão simples. Quando o problema 
envolve duas ou mais variáveis independentes, chama-se 
regressão múltipla. A discussão a seguir descreve breve- 
mente o procedimento básico e conceitos e os ilustra atra- 
vés de um exemplo simples. A discussão se divide em três 
partes para mostrar como a regressão estima a relação 
entre variáveis dependente e independentes. Os seguintes 
tópicos são cobertos: 


1. Estabelecimento de uma previsão de referência sem uma va- 
riável independente, usando somente a média da variável 
dependente. 

2. Previsão usando uma única variável independente — regres- 
são simples. 

3. Previsão usando diversas variáveis independentes — regres- 
são múltipla. 
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Para ilustrar os princípios básicos envolvidos, são forneci- 
dos os resultados de um pequeno estudo de oito famílias 
sobre seu uso de cartão de crédito. O propósito do estudo 
era determinar quais fatores afetavam o número de car- 
tões de crédito usados. Três fatores potenciais foram iden- 
tificados (tamanho da família, renda familiar e número de 
automóveis da família) e foram coletados dados de cada 
uma das oito famílias (ver Tabela 4-1). Na terminologia 
da análise de regressão, a variável dependente (Y) é o nú- 
mero de cartões de crédito usados, e as três variáveis inde- 
pendentes (V,, V,e V.) são o tamanho da família, a renda 
familiar e o número de automóveis, respectivamente. 


Estabelecimento de um ponto de referência: 
previsão sem uma variável independente 


Antes de estimar a primeira equação de regressão, co- 
mecemos calculando o ponto de referência com o qual 
compararemos a habilidade preditiva de nossos modelos 
de regressão. O ponto de referência deve representar nos- 
sa melhor previsão sem o uso de variáveis independen- 
tes. Poderíamos usar qualquer número de opções (p.ex., 
previsão perfeita, um valor pré-especificado, ou uma das 
medidas de tendência central, como média, mediana ou 
moda). O preditor de referência usado em regressão é a 
média simples da variável dependente, que tem diversas 
propriedades desejáveis que discutimos adiante. 

O pesquisador ainda deve responder uma questão: 
quão precisa é a previsão? Como a média não irá prever 
perfeitamente cada valor da variável dependente, deve- 
mos criar algum modo de avaliar a precisão preditiva que 
possa ser usado tanto na previsão de referência quanto 
nos modelos de regressão que criamos. O modo usual de 
avaliar a precisão de qualquer previsão é examinar os er- 
ros na previsão da variável dependente. 

Apesar de podermos esperar obter uma medida útil de 
precisão de previsão simplesmente somando os erros, isso 
não seria interessante, pois os erros, ao se usar o valor mé- 
dio, sempre somam zero. Logo, a soma simples de erros 
nunca mudaria, não importa quão bem ou mal previmos 


TABELA 4-1 


a variável dependente ao usar a média. Para superar esse 
problema, calculamos o quadrado de cada erro e então 
somamos os resultados. Esse total, chamado de soma de 
quadrados dos erros (SS,.), fornece uma medida de preci- 
são de previsão que varia de acordo com a quantia de er- 
ros de previsão. O objetivo é obter a menor soma possível 
de quadrados dos erros (chamados de erros quadrados) 
como nossa medida de precisão de previsão. 

Escolhemos a média aritmética porque ela sempre 
produz uma soma menor dos erros quadrados do que 
qualquer outra medida de tendência central, incluindo 
a mediana, moda, qualquer outro valor de um dado ou 
qualquer outra medida estatística mais sofisticada (enco- 
rajamos os leitores interessados a tentar encontrar um va- 
lor preditivo melhor do que a média). 


Em nosso exemplo, a média aritmética (ou média) da va- 
riável dependente (número de cartões de crédito usados) 
é sete (ver Tabela 4-2). Nossa previsão de referência pode 
então ser enunciada como “O número previsto de cartões 
de crédito usados por uma família é sete”. Também pode- 
mos escrever isso como uma equação de regressão: 


Número médio de 
cartões de crédito 


Número previsto de 
cartões de crédito 


ou = 

ey 
Com nossa previsão de referência de cada família usando 
sete cartões de crédito, superestimamos o número de car- 
tões de crédito usados pela família 1 por três. Assim, o erro 
é -3. Se este procedimento fosse seguido para cada família, 
algumas estimativas seriam muito altas, outras seriam mui- 
to baixas, e outras ainda poderiam ser exatamente corre- 
tas. Para nossa pesquisa das oito famílias, usando a média 
como nossa previsão de referência, conseguimos o melhor 
preditor do número de cartões de crédito, com uma soma 
de erros quadrados de 22 (ver Tabela 4-2). Em nossa dis- 
cussão sobre regressão simples e múltipla, usamos a previ- 
são pela média como uma referência para comparação, por 
representar a melhor previsão possível sem usar qualquer 
variável independente. 


Resultados de pesquisa sobre uso de cartão de crédito 


Número de cartões 
de crédito usados (Y) 


Identificação da 
família 


Tamanho da família 


(Vi) 


Número de automó- 
veis da família (V,) 


Renda familiar (mi- 
lhares de US$) (V,) 


oNV o qa son 


2 


(o) o» 6) O 6 E] 


14 
16 
14 
17 
18 
21 
17 
25 


PP + 190 +44 Nha 
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TABELA 4-2 Previsão de referência usando a média da variável dependente 


Variável estatística de regressão: Y=y 
Equação de previsão: Visit 
Número de car- 
Identificação tões decrédito Previsão de Erro de Erro quadrado 
da família usados referência” previsão” de previsão 

1 4 7 —3 9 

2 6 7 — 1 

3 6 7 — 1 

4 7 7 0 0 

5 8 7 +1 1 

6 7 7 0 0 

7 8 7 +1 1 

8 10 7 +3 9 

Total 56 0 22 


“Número médio de cartões de créditos usados = 56/8 = 7. 
“Erro de previsão se refere ao valor real da variável dependente menos o valor previsto. 


Previsão usando uma única variável 
independente: regressão simples 


Como pesquisadores, estamos sempre interessados em 
melhorar nossas previsões. Na seção anterior, apren- 
demos que a média da variável dependente é o melhor 
preditor quando não usamos variáveis independentes. 
Porém, como pesquisadores, estamos buscando uma ou 
mais variáveis adicionais (independentes) que possam 
melhorar esse valor de referência. Quando procuramos 
apenas uma variável independente, chamamos de regres- 
são simples. Esse procedimento para prever dados (assim 
como a média faz) usa a mesma regra: minimizar a soma 
de erros quadrados de previsão. O objetivo do pesquisa- 
dor para regressão simples é encontrar uma variável inde- 
pendente que melhore a previsão de referência. 


Em nossa pesquisa de oito famílias, também coletamos in- 
formações sobre medidas que poderiam atuar como variá- 
veis independentes. Sabemos que sem o uso de qualquer 
uma dessas variáveis independentes, a melhor previsão 
que podemos fazer sobre o número de cartões de crédito 
usados é o valor médio 7. Mas podemos fazer melhor? 
Será que uma de nossas variáveis independentes fornece 
informação que nos permite realizar previsões melhores 
do que aquelas conseguidas apenas com a média? 


O papel do coeficiente de correlação 

Apesar de podermos ter qualquer número de variáveis 
independentes, a questão diante do pesquisador é: qual 
escolher? Poderíamos tentar cada variável e ver qual nos 
dá a melhor previsão, mas essa abordagem é impraticável 
mesmo quando o número de possíveis variáveis indepen- 
dentes é muito pequeno. Ao invés disso, podemos confiar 
no conceito de associação, representado pelo coeficiente 
de correlação. Duas variáveis são ditas correlacionadas se 
mudanças em uma são associadas com mudanças na outra. 


Desse modo, quando uma variável muda, sabemos como a 
outra mudará. O conceito de associação, representado pelo 
coeficiente de correlação (r), é fundamental na análise de 
regressão, representando a relação entre duas variáveis. 

Como esse coeficiente ajudará a melhorar nossas previ- 
sões? Vejamos novamente o uso de média como referên- 
cia de previsão. Ao usarmos a média, devemos observar 
um fato: o valor médio nunca muda (lembre que sempre 
usamos 7 como valor previsto em nosso exemplo). Como 
tal, a média tem uma correlação nula com os valores reais. 
Como melhoramos esse método? Queremos uma variá- 
vel que, ao invés de ter apenas um valor, tem valores que 
são altos quando o número de cartões de crédito é alto e 
valores baixos quando o número de cartões de crédito é 
baixo. Se podemos achar uma variável que exibe padrão 
similar (uma correlação) ao da variável dependente, de- 
vemos ser capazes de melhorar nossa previsão feita com 
o uso apenas da média. Quanto mais similares (mais altas 
correlações), melhores previsões teremos. 


Usando nossas informações da pesquisa sobre as três 
variáveis independentes, podemos tentar melhorar nos- 
sas previsões reduzindo os erros de previsão. Para fazer 
isso, os erros de previsão no número de cartões de crédi- 
to usados devem ser associados (correlacionados) a uma 
das variáveis independentes potenciais (V,, V, ou V.). Se 
V, estiver correlacionada com o uso de cartões de crédi- 
to, podemos usar essa relação para prever o número de 
cartões de crédito do seguinte modo: 


Variação no número 


Número de cartões de crédito la 
previsto de = usados associada à DO dev 
cartões de variação de uma i 

crédito unidade em V, 
ou 


P=by 
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Adição de uma constante ou um termo intercepto 
Ao fazer a previsão da variável dependente, podemos des- 
cobrir que é possível melhorar nossa precisão usando uma 
constante no modo de regressão. Conhecida como intercep- 
to, ela representa o valor da variável dependente quando to- 
das as variáveis independentes têm um valor nulo. Grafica- 
mente ela representa o ponto no qual a reta que descreve o 
modelo de regressão cruza o eixo Y, daí o nome intercepto. 


Uma ilustração do procedimento é mostrada na Tabela 
4-3 para alguns dados hipotéticos (não o exemplo com car- 
tões de crédito) com uma única variável independente, X,. 
Se percebemos que, quando X, aumenta uma unidade, a 
variável dependente aumenta (na média) duas unidades, 
podemos então fazer previsões para cada valor da variável 
independente. Por exemplo, quando X, tivesse um valor 
de 4, preveríamos um valor de 8 (ver Tabela 4-3a). Logo, o 
valor previsto sempre é duas vezes o valor de X, (2 X,). No 
entanto, fregientemente notamos que a previsão é melho- 
rada acrescentando-se um valor constante. Na Tabela 4-3a 
podemos ver que a previsão simples de 2x X, está erra- 
da por duas unidades em cada caso. Logo, a mudança em 
nossa descrição pelo acréscimo de uma constante de dois a 
cada previsão nos dá previsões perfeitas em todos os casos 
(ver Tabela 4-3b). Veremos que, quando estimamos uma 
equação de regressão, geralmente é bom incluir uma cons- 
tante, que é chamada de intercepto. 


Estimação da equação de regressão simples 

Podemos selecionar a “melhor” variável independen- 
te com base nos coeficientes de correlação, pois quanto 
maior este coeficiente, mais forte a relação e, portanto, 
maior a precisão preditiva. Na equação de regressão, re- 
presentamos o intercepto como b,. A quantia de mudança 


na variável dependente devido à variável independente 
é representada pelo termo b,, também conhecido como 
coeficiente de regressão. Usando um procedimento ma- 
temático chamado de mínimos quadrados [8, 11, 15], po- 
demos estimar os valores de by e b, tal que a soma dos 
erros quadrados de previsão seja minimizada. O erro de 
previsão, a diferença entre os valores reais e previstos da 
variável dependente, é chamado de resíduo (e ou £). 


A Tabela 4-4 contém uma matriz de correlações entre a 
variável dependente (Y) e as independentes (V,, V,ou 
V,). que pode ser usada na escolha da melhor variável 
independente. Olhando abaixo a primeira coluna, pode- 
mos ver que V,, tamanho da família, tem a maior cor- 
relação com a variável dependente e, desse modo, é a 
melhor candidata para nossa primeira regressão simples. 
A matriz de correlação também contém as correlações 
entre as variáveis independentes, que veremos serem 
muito importantes em regressão múltipla (duas ou mais 
variáveis independentes). 

Agora podemos estimar nosso primeiro modelo de 
regressão simples para a amostra de oito famílias e ver 
quão bem a descrição se ajusta aos nossos dados. O mo- 
delo de regressão pode ser enunciado como se segue: 


Variação no número 


Número de cartões de crédito 
previsto de = [Intercepto) + usados associada à |x Tamanho 
cartões de variação de uma da família 


unidade no tamanho 
da família 


crédito usados 


ou 
YP=,+b1, 


Neste exemplo, os valores apropriados são uma cons- 
tante (b,) de 2,87 e um coeficiente de regressão (b,) de 
0,97 para tamanho da família. 


TABELA 4-3 Melhoramento da precisão de previsão com o acréscimo de um 


intercepto em uma equação de regressão 


(A) PREVISÃO SEM O INTERCEPTO 
Equação de previsão: Y=2X, 


Valor de X, Variável dependente Previsão Erro de previsão 
1 4 2 2 
2 6 4 2 
3 8 6 2 
4 10 8 2 
5 12 10 2 


(B) PREVISÃO COM UM INTERCEPTO DE 2,0 


Equação de previsão: Y=2,0+2X, 


Valor de X, Variável dependente Previsão Erro de previsão 
1 4 4 0 
2 6 6 0 
3 8 8 0 
4 10 10 0 
5 12 12 0 
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TABELA 4-4 Matriz de correlação para o estudo de uso de cartões de crédito 


Variável Y V, VA V; 
Y Número de cartões de crédito usados 1,000 
V, Tamanho da família 0,866 1,000 
V, Renda familiar 0,829 0,673 1,000 
V, Número de automóveis 0,342 0,192 0,301 1,000 


Interpretação do modelo de regressão simples 


Com o intercepto e o coeficiente de regressão estimados 
pelo procedimento de mínimos quadrados, a atenção ago- 


ra se volta à interpretação desses dois valores: 


e Coeficiente de regressão. A variação estimada na variável de- 


pendente por variação unitária da variável independente. Se o 

coeficiente de regressão é percebido como estatisticamente sig- 

nificante (ou seja, o coeficiente é significativamente diferente 
de zero), o valor do coeficiente de regressão indica a extensão 
na qual a variável independente se associa com a dependente. 

e Intercepto. A interpretação do intercepto é de algum modo 

diferente. O intercepto tem valor explanatório apenas den- 

tro do domínio de valores para as variáveis independentes. 

Além disso, sua interpretação se baseia nas características 

da variável independente: 

e Emtermossimples, o intercepto tem valor interpretativo so- 
mente quando zero é um valor conceitualmente válido para 
a variável independente (i.e., a variável independente pode 
ter um valor nulo e ainda manter sua relevância prática). 
Por exemplo, considere que a variável independente é dóla- 
res para anúncios. Se for realista que, em algumas situações, 
nenhum anúncio é feito, então o intercepto representará o 
valor da variável dependente quando anúncio é nulo. 

e Se o valor independente representa uma medida que ja- 
mais pode ter um valor verdadeiro de zero (p.ex., atitu- 
des ou percepções), o intercepto auxilia no melhoramen- 
to do processo de previsão, mas sem valor explanatório. 


Para algumas situações especiais nas quais sabe-se que 


a relação específica pode passar pela origem, o intercepto 
pode ser suprimido (conhecido como regressão pela ori- 
gem). Nesses casos, a interpretação dos resíduos e dos co- 


eficientes de regressão muda um pouco. 


Nosso modelo de regressão prevendo uso de cartões de 
crédito indica que para cada membro a mais da família, 
o número de cartões de crédito possuídos é maior, em 
média, em 0,97. A constante 2,87 pode ser interpretada 
apenas no âmbito dos valores para a variável indepen- 
dente. Nesse caso, um tamanho de família de zero não é 
possível, e assim o intercepto sozinho não tem qualquer 
significado prático. Contudo, isso não invalida seu uso, 
já que ele ajuda na previsão de uso de cartões de cré- 
dito para cada tamanho possível de família (em nosso 
exemplo, de 1 a 5%). A equação de regressão simples e 
as previsões e os resíduos resultantes para cada uma das 
oito famílias são exibidos na Tabela 4-5. 

Como usamos o mesmo critério (minimizar a soma 
dos quadrados dos erros ou mínimos quadrados), pode- 
mos determinar se nosso conhecimento do tamanho da 
família nos ajuda a melhor prever o uso de cartões de 
crédito comparando a previsão por regressão simples 
com a previsão de referência. A soma dos quadrados 
dos erros usando a média (o ponto de referência) foi 22; 
com nosso novo procedimento com uma única variável 
independente, a soma dos quadrados dos erros diminui 
para 5,50 (ver Tabela 4-5). Usando o procedimento dos 
mínimos quadrados e uma única variável independente, 
vemos que nossa nova abordagem, a regressão simples, é 
evidentemente melhor para previsões do que empregar 
apenas a média. 


* N. de R. T.: A frase correta seria “em nosso exemplo, de 2 a 6”. 


TABELA 4-5 Resultados de regressão simples usando tamanho de família como variável independente 


Variável estatística de regressão: 
Equação de previsão: 


Y=b+b,V, 
Y=2,87+0,97V, 


Identificação da Número de cartões 


Tamanho da fa- 


Previsão de re- Erro quadrado 


família de crédito usados mília (V,) gressão simples Erro de previsão de previsão 
1 4 2 4,81 -0,81 0,66 
2 6 2 4,81 1,19 1,42 
3 6 4 6,75 —0,75 0,56 
4 7 4 6,75 0,25 0,06 
5 8 5 7,72 0,28 0,08 
6 7 5 7,72 —0,72 0,52 
7 8 6 8,69 —0,69 0,48 
8 10 6 8,69 1,31 1,72 
Total 5,50 
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Estabelecimento de um intervalo de confiança 
para os coeficientes de regressão e o valor previsto 
Como usamos apenas uma amostra de observações para 
estimar uma equação de regressão, podemos esperar que 
os coeficientes de regressão variem se selecionarmos ou- 
tra amostra de observações e estimarmos outra equação 
de regressão. Não queremos considerar repetidas amos- 
tras; assim, precisamos de um teste empírico para ver se 
o coeficiente de regressão estimado tem algum valor real 
(i.e., é diferente de zero?) ou se poderíamos esperar que 
ele se iguale a zero em outra amostra. Para abordar essa 
questão, a análise de regressão permite o teste estatístico 
do intercepto e dos coeficientes de regressão para deter- 
minar se eles são significativamente diferentes de zero (ou 
seja, eles têm um impacto que podemos esperar com uma 
probabilidade especificada que seja diferente de zero em 
qualquer número de amostras de observações). 

Com a variação esperada no intercepto e no coeficien- 
te de regressão ao longo das amostras, devemos também 
esperar que o valor previsto varie cada vez que selecio- 
narmos outra amostra de observações e estimarmos outra 
equação de regressão. Assim, gostaríamos de estimar o 
intervalo de valores previstos que podemos esperar, em 
vez de confiar apenas na estimativa única (pontual). A es- 
timativa pontual é a melhor estimativa da variável depen- 
dente para essa amostra de observações e pode se mostrar 
que ela corresponde à previsão média para qualquer valor 
dado da variável independente. 

A partir dessa estimativa pontual, também podemos 
calcular o intervalo dos valores previstos em amostras re- 
petidas com base em uma medida dos erros de previsão 
que esperamos cometer. Conhecida como o erro padrão 
da estimativa (SE,), essa medida pode ser definida sim- 
plesmente como o desvio-padrão esperado dos erros de 
previsão. Para qualquer conjunto de valores de uma va- 
riável, podemos construir um intervalo de confiança para 
uma variável em torno de seu valor médio acrescentando 
(mais e menos) um determinado número de desvios-pa- 
drão. Por exemplo, o acréscimo de +1,96 desvios-padrão 
à média define um intervalo para grandes amostras que 
inclui 95% dos valores de uma variável. 

Podemos seguir um método semelhante para as previ- 
sões obtidas a partir de um modelo de regressão. Usando 
a estimativa pontual, podemos acrescentar (mais e menos) 
um determinado número de erros padrão da estimativa (de- 
pendendo do nível de confiança desejado e do tamanho da 
amostra) para estabelecer os limites superior e inferior para 
nossas previsões feitas com variável(eis) independente(s). 
O erro padrão da estimativa (SE,.) é calculado por 


SE | Soma de erros quadrados 
B Tamanho da amostra — 2 


O número de SE,s a usar na obtenção do intervalo 
de confiança é determinado pelo nível de significância 
(ot) e pelo tamanho da amostra (N), o que dá um valor 


t. O intervalo de confiança é então calculado com o me- 
nor limite igual ao valor previsto menos (SE, x valor 1), 
e o limite superior, como o valor previsto mais (SE, x 
valor t). 


Para nosso modelo de regressão simples, SE, = + 0,957 
(a raiz quadrada do valor de 5,50 dividido por 6). O 
intervalo ou domínio de confiança para as previsões é 
construído selecionando-se o número de erros padrão 
a acrescentar (mais e menos), por meio da consulta em 
uma tabela para a distribuição t e da seleção do valor 
para nível de confiança e tamanho da amostra específi- 
cos. Em nosso exemplo, o valor t para um nível de con- 
fiança de 95% com seis graus de liberdade (tamanho da 
amostra menos o número de coeficientes, ou8 -2 = 6) é 
2,447. A quantia acrescentada (mais e menos) ao valor 
previsto é então (0,957 x 2,447), ou 2,34. Se substituí- 
mos o tamanho médio da família (4,25) na equação de 
regressão, o valor previsto é 6,99 (difere da média de 7 
só por causa de arredondamento). O intervalo esperado 
de cartões de crédito fica de 4,65 (6,99 - 2,34) a 9,33 (6,99 
+ 2,34). O intervalo de confiança pode ser aplicado a 
qualquer valor previsto de cartões de crédito. Para uma 
discussão mais detalhada desses intervalos de confiança, 
ver Neter et al. [11]. 


Avaliação da precisão de previsão 

Se a soma de quadrados dos erros (SS) representa uma 
medida de nossos erros de previsão, também devemos 
conseguir determinar uma medida de nosso sucesso de 
previsão, o qual podemos chamar de soma de quadrados 
da regressão (SS,). Juntas, essas duas medidas devem 
igualar a soma total de quadrados (SS), o mesmo valor 
de nossa previsão de referência. Como o pesquisador 
acrescenta variáveis independentes, a soma total de qua- 
drados agora pode ser dividida em (1) a soma de quadra- 
dos prevista pela(s) variável(eis) independente(s), que é 
a soma de quadrados da regressão (SSp), e (2) a soma de 
quadrados dos erros (SS): 


30-50, IPO, 


SS, = Ss + SS 


E R 


Soma total de quadrados = Soma de erros quadrados + 
Soma de quadrados de regressão 
onde 


Y = média de todas as observações 
Y, = valor da observação individual í 


é = valor previsto da observação i 


Podemos usar essa divisão da soma total de quadra- 
dos para estimar o quão bem a variável estatística de 
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regressão descreve a variável dependente. Lembre-se 
que a média da variável dependente é nossa melhor es- 
timativa de referência. Sabemos que não é uma estima- 
tiva muito precisa, mas é a melhor estimativa disponível 
sem o emprego de outras variáveis quaisquer. A questão 
agora é: a precisão preditiva aumenta quando a equação 
de regressão é usada no lugar da previsão de referência? 
Podemos quantificar esse melhoramento com o que se 
segue: 

Soma total de quadrados (previsão de referência) SS 
— Soma de erros (regressão simples) — SS 


Erro 


Soma de quadrados explicada (regressão simples) SS 


Regressão 


A soma de quadrados explicada (SS,) representa as- 
sim uma melhoria na previsão em relação à previsão de 
referência. Outro modo de expressar esse nível de pre- 
cisão de previsão é com o coeficiente de determinação 
(R?), a razão entre a soma de quadrados da regressão e 
a soma total de quadrados, como mostrado na equação 
seguinte: 


Coeficiente de Soma de quadrados de regressão 


determinação (R?) Soma total de quadrados 

Se o modelo de regressão previu perfeitamente a variá- 
vel dependente, R” = 1,0. Mas se não forneceu previsões 
melhores do que o uso da média (previsão de referência), 
Rº = 0. Assim o valor Rº é uma medida única de precisão 
de previsão geral representando o seguinte: 


e O efeito combinado da variável estatística inteira na previ- 
são, mesmo quando a equação de regressão contém mais de 
uma variável independente. 

e Simplesmente a correlação quadrada dos valores reais e 
previstos. 


Quando o coeficiente de correlação (r) é usado para 
avaliar a relação entre variáveis dependente e indepen- 
dentes, o sinal do coeficiente de correlação (—r,+r) deno- 
ta o coeficiente angular da reta de regressão. Contudo, a 
força da relação é representada por Rº, a qual com certeza 
sempre é positiva. Quando discussões mencionam a varia- 
ção da variável dependente, elas se referem a essa soma 
total de quadrados que a análise de regressão tenta prever 
com uma ou mais variáveis independentes. 


Em nosso exemplo, a previsão de referência é o nú- 
mero médio de cartões de créditos usados por nossas 
famílias da amostra e é a melhor previsão disponível 


sem o uso de outras variáveis. A precisão de previsão 
de referência usando a média foi medida calculando-se 
a soma de quadrados dos erros em relação à referência 
(soma de quadrados = 22). Agora que ajustamos um 
modelo de regressão usando tamanho da família, isso 
explica a variação melhor que a média? Sabemos que 
de algum modo é melhor porque a soma de quadrados 
dos erros agora diminuiu para 5,50. Podemos olhar o 
quão bem nosso modelo prevê examinando esse apri- 
moramento. 


Soma total de quadrados (previsão de referência) SS 
SS) 


Erro 


— Soma de erros quadrados (regressão simples) 


Soma de quadrados explicada (regressão simples) O anti 
SS, 22,0 

ou SS, = 
SS, 16,5 


Logo, explicamos 16,5 quadrados dos erros mu- 
dando da média para o modelo de regressão simples 
usando tamanho da família. Esse é um melhoramento 
de 75% (16,5/22 = 0,75) sobre a referência. Estabele- 
cemos assim que o coeficiente de determinação (R?) 
para essa equação de regressão é 0,75, o que significa 
que ela explica 75% da variação possível na variável 
dependente. Lembre também que o valor Rº é simples- 
mente a correlação ao quadrado entre os valores reais 
e previstos. 


Previsão usando diversas variáveis 

independentes: regressão múltipla 

Demonstramos previamente o quanto a regressão sim- 
ples pode ajudar a melhorar nossa previsão de uma va- 
riável dependente (p.ex., usando dados sobre o tamanho 
da família, previmos o número de cartões de crédito que 
uma família usaria muito mais precisamente do que po- 
deríamos se usássemos apenas a média aritmética). Esse 
resultado levanta a questão da possibilidade de melho- 
rarmos nossa previsão ainda mais, usando dados adicio- 
nais obtidos das variáveis independentes (p.ex., outros 
dados das famílias). Nossa previsão melhoraria se usás- 
semos não apenas dados sobre o tamanho da família, 
mas informações sobre uma outra variável, como talvez 
renda familiar ou número de automóveis que cada famí- 
lia possui? 


O impacto de multicolinearidade 

A habilidade de uma variável independente adicional 
de melhorar a previsão da variável dependente está re- 
lacionada não apenas à sua correlação com a variável 
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dependente, mas também com a(s) correlação(ões) da 
variável independente adicional com a(s) variável(eis) 
independente(s) já incluídas na equação de regressão. A 
colinearidade é a associação, medida como a correlação, 
entre duas variáveis independentes. A multicolinearidade 
refere-se à correlação entre três ou mais variáveis inde- 
pendentes (evidenciada quando uma é “regredida” em 
relação às outras). Apesar de haver uma distinção precisa 
entre esses dois conceitos em termos estatísticos, é prática 
comum usar os termos alternadamente. 

Como era de se esperar, correlação entre as variáveis 
independentes pode ter um forte impacto sobre o modelo 
de regressão: 


e Oimpacio da multicolinearidade é reduzir o poder preditivo 
de qualquer variável independente na medida em que ela é 
associada com as outras variáveis independentes. Quando a 
colinearidade aumenta, a variância única explicada por con- 
ta de cada variável independente diminui e o percentual da 
previsão compartilhada aumenta. Como essa previsão com- 
partilhada pode ser considerada apenas uma vez, a previsão 
geral aumenta muito mais vagarosamente quando variáveis 
independentes com multicolinearidade elevada são acres- 
centadas. 

e Para maximizar a previsão a partir de um dado número de 
variáveis independentes, o pesquisador deve procurar variá- 
veis independentes que tenham baixa multicolinearidade com 
as outras variáveis independentes, mas também apresentem 
correlações elevadas com a variável dependente. 


Revisitamos as questões sobre a colinearidade e a mul- 
ticolinearidade em seções posteriores para discutir suas 
implicações na seleção de variáveis independentes e na 
interpretação da variável estatística de regressão. 


A equação de regressão múltipla 

Como observado anteriormente, regressão múltipla é o 
uso de duas ou mais variáveis independentes na previsão 
de uma variável dependente. A tarefa do pesquisador é 
expandir o modelo de regressão simples acrescentando va- 
riáveis independentes que tenham o maior poder preditivo 
adicional. Ainda que possamos determinar a associação 
de qualquer variável independente com a dependente 
através do coeficiente de correlação, a amplitude do poder 
preditivo incremental para qualquer variável adicional é 
muitas vezes determinada por sua multicolinearidade com 
outras variáveis já presentes na equação de regressão. Po- 
demos olhar nosso exemplo com cartões de crédito para 
demonstrar tais conceitos. 


Para melhorar ainda mais nossa previsão de uso de car- 
tões de crédito, usemos dados adicionais obtidos a partir 
de nossas oito famílias. A segunda variável independen- 
te a ser incluída no modelo de regressão é a renda fami- 
liar (V,), que tem a próxima correlação mais alta com a 


variável dependente. Apesar de V, ter um grau médio 
de correlação com V,, já presente na equação, ainda é 
a segunda melhor variável a entrar, pois V, tem uma 
correlação muito menor com a variável dependente. 
Simplesmente expandimos nosso modelo de regressão 
simples para incluir duas variáveis independentes, como 
a seguir: 


Número previsto de cartões de crédito 
usados=b,+b,V,+b,V,+e 


onde 


b, = número constante de cartões de crédito indepen- 
dentemente do tamanho da família e da renda fa- 
miliar 

= variação no uso de cartões de crédito em relação à 
variação de uma unidade no tamanho da família 

b, = variação no uso de cartões de crédito em relação à 

variação de uma unidade na renda familiar 

V, = tamanho da família 

V, = renda familiar 

e = erro de previsão (resíduo) 

O modelo de regressão múltipla com duas variáveis 
independentes, quando estimado com o procedimento 
de mínimos quadrados, tem uma constante de 0,482, 
com coeficientes de regressão de 0,63 e 0,216 para V, 
e V,, respectivamente. Podemos determinar novamen- 
te nossos resíduos prevendo Y e subtraindo a previsão 
do verdadeiro valor. Em seguida, elevamos ao quadra- 
do o erro de previsão resultante, como na Tabela 4-6. A 
soma de quadrados dos erros para o modelo de regres- 
são múltipla com tamanho da família e renda familiar é 
3,04. Este resultado pode ser comparado com o valor do 
modelo de regressão simples de 5,50 (Tabela 4-5), o qual 
usa apenas o tamanho da família para a previsão. 

Quando a renda familiar é adicionada à análise de 
regressão, R” também aumenta para 0,86. 


oa 
I 


2 22,0-3,04 18,96 


(tamanho da família + renda familiar) — 22.0 E 22.0 - 
> , 


0,86 


A inclusão da renda familiar na análise de regressão 
aumenta a previsão em 11% (0,86 — 0,75), devido ao po- 
der preditivo incremental único da renda familiar. 


Acréscimo de uma terceira 

variável independente 

Percebemos um aumento na precisão de previsão, con- 
quistado ao mudar-se da equação de regressão simples 
para a equação de regressão múltipla, mas também deve- 
mos observar que em algum ponto o acréscimo de variá- 
veis independentes se tornará menos vantajoso, e em al- 
guns casos até mesmo contraprodutivo. A adição de mais 
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TABELA 4-6 Resultados de regressão múltipla usando tamanho de família e renda familiar como variáveis independentes 


Variável estatística de regressão: 
Equação de previsão: 


Y=bo+b,V,+ DV, 


Y=0,482 + 0,63V, + 0,216V, 


Renda 
Identificação Número de cartões Tamanho da familiar (V,) Previsão da Erro de Erro quadrado 
dafamília 'decrédito usados família (V,) (milhares de US$) regressão múltipla previsão de previsão 
1 14 4,76 —0,76 0,58 
2 6 2 16 5,20 0,80 0,64 
3 6 4 14 6,03 —0,03 0,00 
4 7 4 17 6,68 0,32 0,10 
5 8 5 18 7,53 0,47 0,22 
6 7 5 21 8,18 —1,18 1,39 
7 8 6 17 7,95 0,05 0,00 
8 10 6 25 9,67 0,33 0,11 
Total 3,04 


variáveis independentes se baseia em balancear entre 
poder preditivo aumentado versus modelos de regressão 
excessivamente complexos e até mesmo potencialmente 
enganosos. 


A pesquisa do uso de cartões de crédito fornece mais 
uma possível adição à equação de regressão múltipla, o 
número de automóveis possuídos (V.,). Se agora especifi- 
carmos a equação de regressão para incluir as três variá- 
veis independentes, perceberemos alguma melhora na 
equação de regressão, mas inferior à vista anteriormen- 
te. O valor Rº aumentará para 0,87, apenas um aumento 
de 0,01 em relação ao modelo de regressão múltipla an- 
terior. Além disso, como discutiremos posteriormente, o 
coeficiente de regressão para V, não é estatisticamente 
significante. Logo, nesse caso, o pesquisador está melhor 
servido empregando o modelo de regressão múltipla 
com duas variáveis independentes (tamanho da família 
e renda familiar) e não usando a terceira variável inde- 
pendente (número de automóveis possuídos) para fazer 
previsões. 


Resumo 

A análise de regressão é uma técnica de dependência 
simples e direta que pode fornecer previsão e explicação 
ao pesquisador. O exemplo anterior ilustrou os conceitos 
e procedimentos básicos inerentes à análise de regressão 
em uma tentativa de desenvolver uma compreensão da 
metodologia e características desse procedimento em 
sua forma mais básica. As seções a seguir detalham essas 
questões e fornecem um processo de decisão para aplicar 
a análise de regressão a qualquer problema de pesquisa 
apropriado. 


UM PROCESSO DE DECISÃO PARA A 
ANÁLISE DE REGRESSÃO MÚLTIPLA 


Nas seções anteriores, discutimos exemplos de regressão 
simples e múltipla. Naquelas discussões, muitos fatores 
influenciaram nossa habilidade de encontrar o melhor 
modelo de regressão. Até esse ponto, no entanto, exa- 
minamos tais questões apenas em termos simples, com 
pouca preocupação em como elas se combinam em uma 
abordagem geral da análise de regressão múltipla. Nas 
seções a seguir, o processo de construção de modelo em 
seis estágios, introduzido no Capítulo 1, será usado como 
referência para discutir os fatores que afetam a criação, 
estimação, interpretação e validação de uma análise de 
regressão. O processo começa com a especificação dos 
objetivos da análise de regressão, incluindo a seleção das 
variáveis dependente e independentes. O pesquisador en- 
tão começa a planejar a análise de regressão, consideran- 
do fatores como o tamanho da amostra e a necessidade de 
transformações de variáveis. Com o modelo de regressão 
formulado, as suposições inerentes à análise de regressão 
são primeiramente testadas para as variáveis individuais. 
Se todas as suposições forem atendidas, então o modelo 
será estimado. Quando já se têm os resultados, são fei- 
tas análises diagnósticas para garantir que o modelo geral 
atende às suposições de regressão e que nenhuma obser- 
vação tem influência indevida sobre os resultados. O pró- 
ximo estágio é a interpretação da variável estatística de 
regressão; examina-se o papel desempenhado por cada 
variável independente na previsão da medida dependente. 
Finalmente, os resultados são validados para garantir ge- 
neralização para a população. As Figuras 4-1 e 4-6 repre- 
sentam os estágios 1-3 e 4-6, respectivamente, fornecendo 
uma representação gráfica do processo de construção do 
modelo para regressão múltipla, e as seções a seguir discu- 
tem cada passo em detalhes. 
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Estágio 1 


Estágio 2 


Problema de pesquisa 


Selecionar objetivo(s) 
Previsão 
Explicação 
Selecionar variáveis dependente e independentes 


Questões de delineamento de pesquisa 


Obter um tamanho adequado de amostra para garantir: 
Poder estatístico 
Generalização 


Criação de variáveis adicionais 


Transformações para atender suposições 


Polinômios para relações curvilíneas 


Variáveis dicotômicas para uso de variáveis não-métricas 


Termos de interação para efeitos moderadores 


“A variável 
estatística de 
regressão atende 
às suposições...” 


Estágio 3 


Suposições em regressão múltipla 


Normalidade 
Linearidade 
Homoscedasticidade 


As variáveis individuais atendem às suposições de: 


Independência de termos de erro? 


T 
Sim 


Para o 
estágio 
4 


FIGURA 4-1 Estágios 1-3 no diagrama de decisão de regressão múltipla. 


ESTÁGIO 1: OBJETIVOS DA 
REGRESSÃO MÚLTIPLA 


A análise de regressão múltipla, uma forma de modela- 
gem linear geral, é uma técnica estatística multivariada 
usada para examinar a relação entre uma única variável 
dependente e um conjunto de variáveis independentes. O 
ponto de partida necessário na regressão múltipla, como 
ocorre em todas as técnicas estatísticas multivariadas, é o 
problema de pesquisa. A flexibilidade e a adaptabilidade 
da regressão múltipla permitem seu uso em quase toda re- 
lação de dependência. Ao selecionar aplicações adequa- 
das de regressão múltipla, o pesquisador deve considerar 
três questões principais: 

1. Adequação do problema de pesquisa 

2. Especificação de uma relação estatística 

3. Seleção das variáveis dependente e independentes 


Problemas de pesquisa apropriados 

à regressão múltipla 

A regressão múltipla é de longe a técnica multivariada mais 
utilizada entre aquelas examinadas neste texto. Com sua 
ampla aplicabilidade, a regressão múltipla tem sido usada 
para muitos propósitos. Suas aplicações sempre crescentes 
recaem em duas grandes classes de problemas de pesquisa: 
previsão e explicação. Previsão envolve o quanto que uma 
variável estatística de regressão (uma ou mais variáveis in- 
dependentes) pode prever da variável dependente. Expli- 
cação examina os coeficientes de regressão (sua magnitude, 
sinal e significância estatística) para cada variável indepen- 
dente e tenta desenvolver uma razão substantiva ou teórica 
para os efeitos das variáveis independentes. Tais proble- 
mas de pesquisa não são mutuamente excludentes, e uma 
aplicação da análise de regressão múltipla pode abordar 
qualquer um ou ambos os tipos de problema de pesquisa. 
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Previsão com regressão múltipla 

Um propósito fundamental da regressão múltipla é prever 
a variável dependente com um conjunto de variáveis inde- 
pendentes. Ao fazer isso, a regressão múltipla atinge um 
entre dois objetivos. 


e O primeiro objetivo é maximizar o poder preditivo geral 
das variáveis independentes como representadas na variável 
estatística. Como mostrado em nosso exemplo anterior de 
previsão de uso de cartões de crédito, a variável estatísti- 
ca é formada pela estimação dos coeficientes de regressão 
para cada variável independente de modo a se tornar o 
preditor ótimo da medida dependente. Precisão preditiva 
é sempre crucial para garantir a validade do conjunto de 
variáveis independentes. Medidas de precisão preditiva são 
desenvolvidas e testes estatísticos são usados para avaliar a 
significância do poder preditivo. Em todos os casos, preten- 
dendo o pesquisador interpretar os coeficientes da variável 
estatística ou não, a análise de regressão deve atingir níveis 
aceitáveis de precisão preditiva para justificar sua aplicação. 
O pesquisador deve garantir que tanto a significância esta- 
tística quanto a prática são consideradas (ver as discussões 
no estágio 4). 

Em certas aplicações concentradas apenas na previsão, 
o pesquisador está interessado principalmente em atingir a 
previsão máxima, e interpretar os coeficientes de regressão 
é relativamente pouco importante. Ao invés disso, o pesqui- 
sador emprega as muitas opções na forma e na especificação 
das variáveis independentes que podem modificar a variá- 
vel estatística para aumentar seu poder preditivo, fregien- 
temente maximizando previsão às custas da interpretação. 
Um exemplo específico é uma variante da regressão, análise 
de série temporal, na qual o único propósito é previsão, e 
a interpretação dos resultados é útil só como um meio de 
aumentar a precisão preditiva. 

e A regressão múltipla também pode atingir um segundo 
objetivo de comparar dois ou mais conjuntos de variáveis 
independentes para examinar o poder preditivo de cada va- 
riável estatística. Ilustrativo de uma abordagem confirma- 
tória para modelagem, esse uso da regressão múltipla está 
relacionado com a comparação de resultados entre dois 
ou mais modelos alternativos ou concorrentes. O principal 
foco desse tipo de análise é o poder preditivo relativo entre 
modelos, apesar de que, em qualquer situação, a previsão 
do modelo selecionado deve demonstrar significâncias es- 
tatística e prática. 


Explicação com regressão múltipla 

A regressão múltipla também fornece um meio de ava- 
liar objetivamente o grau e caráter da relação entre va- 
riáveis dependente e independentes, pela formação da 
variável estatística de variáveis independentes e então 
examinando a magnitude, sinal e significância estatística 
do coeficiente de regressão para cada variável indepen- 
dente. Deste modo, as variáveis independentes, além de 
sua previsão coletiva da variável dependente, também 
podem ser consideradas por sua contribuição individual 
à variável estatística e suas previsões. A interpretação da 
variável estatística pode se apoiar em qualquer uma de 


três perspectivas: a importância das variáveis independen- 
tes, os tipos de relações encontradas, ou as inter-relações 
entre as variáveis independentes. 

e A interpretação mais direta da variável estatística de regres- 
são é uma determinação da importância relativa de cada va- 
riável independente na previsão da medida dependente. Em 
todas as aplicações, a seleção de variáveis independentes 
deve ser baseada em suas relações teóricas com a variável 
dependente. A análise de regressão fornece então um meio 
de avaliar objetivamente a magnitude e a direção (positiva 
ou negativa) da relação de cada variável independente. O 
caráter da regressão múltipla que a diferencia de suas con- 
trapartes univariadas é a avaliação simultânea de relações 
entre cada variável independente e a medida dependente. 
Ao fazer essa avaliação simultânea, a importância relativa 
de cada variável independente é determinada. 

e Além de avaliar a importância de cada variável, a regressão 
múltipla também dá ao pesquisador um meio de avaliar a 
natureza das relações entre as variáveis independentes e a 
variável dependente. A relação assumida é uma associação 
linear baseada nas correlações entre as variáveis indepen- 
dentes e a medida dependente. Transformações ou variá- 
veis adicionais também estão disponíveis para avaliar se há 
outros tipos de relações, particularmente relações curvilí- 
neas. Essa flexibilidade garante que o pesquisador possa 
examinar a verdadeira natureza da relação, além da linear 
considerada. 

e Finalmente, a regressão múltipla fornece uma visão das 
relações entre variáveis independentes em sua previsão da 
medida dependente. Essas inter-relações são importantes 
por dois motivos. Primeiro, a correlação entre as variáveis 
independentes pode tornar algumas variáveis redundantes 
no esforço preditivo. Desse modo, elas não são necessárias 
para produzir a previsão ótima, dadas as outras variáveis 
independentes na equação de regressão. Em tais casos, a va- 
riável independente terá uma forte relação individual com 
a variável dependente (correlações bivariadas substanciais 
com a variável dependente), mas tal relação é sensivelmente 
diminuída em um contexto multivariado (a correlação par- 
cial com a variável dependente é baixa quando considerada 
com outras variáveis na equação de regressão). Qual é a in- 
terpretação “correta” nesta situação? Deve o pesquisador 
focalizar a forte correlação bivariada para avaliar impor- 
tância, ou deve a relação reduzida no contexto multivariado 
formar a base para a avaliação da relação da variável com a 
dependente? 

Aqui o pesquisador deve confiar nas bases teóricas 
da análise de regressão para avaliar a “verdadeira” re- 
lação para a variável independente. Em tais situações, o 
pesquisador deve se prevenir contra a determinação da 
importância de variáveis independentes com base somente 
na variável estatística obtida, pois relações entre as variá- 
veis independentes podem mascarar ou confundir relações 
que não são necessárias para fins preditivos, mas que, ain- 
da assim, representam descobertas substantivas. As inter- 
relações entre variáveis podem se estender não apenas a 
seu poder preditivo, mas também a relações entre seus 
efeitos estimados, o que é melhor percebido quando o 
efeito de uma variável independente é condicional a ou- 
tra medida independente. 
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A regressão múltipla fornece análises diagnósticas que 
podem determinar se tais efeitos existem com base em ar- 
gumento empírico ou teórico. Indicações de um grau eleva- 
do de inter-relações (multicolinearidade) entre as variáveis 
independentes podem sugerir o uso de escalas múltiplas, 
como discutido no Capítulo 3. 


Especificação de uma relação estatística 


A regressão múltipla é apropriada quando o pesquisador 
está interessado em uma relação estatística, e não funcio- 
nal. Por exemplo, examinemos a seguinte relação: 


Custo total = Custo variável + Custo fixo 


Se o custo variável for 82 por unidade, o custo fixo for 
$500 e produzirmos 100 unidades, assumimos que o custo 
total será de exatamente 8700 e que qualquer desvio de 
$700 é causado por nossa falta de habilidade em medir 
custos, uma vez que a relação entre custos é fixa. Isso é 
o que se chama de relação funcional, pois esperamos que 
não exista erro algum em nossa previsão. Como tal, sem- 
pre sabemos o impacto de cada variável no cálculo da me- 
dida de resultado. 

Entretanto, em nosso exemplo anterior que lidava com 
dados amostrais representando comportamento humano, 
assumimos que nossa descrição do uso de cartões de cré- 
dito era apenas aproximada, e não uma previsão perfei- 
ta. Ela foi definida como uma relação estatística porque 
sempre há algum componente aleatório na relação em 
exame. Uma relação estatística é caracterizada por dois 
elementos: 


1. Quando múltiplas observações são coletadas, mais de um 
valor da medida dependente geralmente será observado 
para qualquer valor de uma variável independente. 

2. Com base no uso de uma amostra aleatória, o erro na pre- 
visão da variável dependente também é considerado aleató- 
rio, e para uma dada variável independente, podemos ape- 


Custo variável 


6 4 pen 


Custo total 


Custo fixo 


Produção 
(a) Relação funcional 


FIGURA 4-2 Comparação das relações funcional e estatística. 


nas esperar estimar o valor médio da variável dependente 
associado a ela. 


Em nosso exemplo de regressão simples, encontramos 
duas famílias com dois membros, duas com quatro mem- 
bros, e assim por diante, que tinham diferentes quanti- 
dades de cartões de crédito. As duas famílias com qua- 
tro membros mantinham uma média de 6,5 cartões de 
crédito, e nossa previsão era de 6,75. Não é tão precisa 
quanto gostaríamos, mas é melhor do que apenas usar 
a média de 7 cartões de crédito. O erro é considerado 
resultado do comportamento aleatório entre usuários de 
cartões de crédito. 


Em resumo, uma relação funcional calcula um valor 
exato, enquanto uma relação estatística estima um valor 
médio. As duas relações são exibidas na Figura 4-2. Neste 
livro, estamos interessados em relações estatísticas. Nossa 
habilidade de empregar apenas uma amostra de observa- 
ções e em seguida usar os métodos de estimação das téc- 
nicas multivariadas e avaliar a significância das variáveis 
independentes se baseia em teoria estatística. Fazendo 
isso, devemos nos assegurar de atender às suposições es- 
tatísticas inerentes a cada técnica multivariada, pois elas 
são críticas em nossa habilidade de fazer previsões não- 
tendenciosas da variável dependente e interpretações vá- 
lidas das variáveis independentes. 


Seleção de variáveis dependente 

e independentes 

O grande sucesso de qualquer técnica multivariada, inclu- 
sive da regressão múltipla, começa com a seleção das va- 
riáveis a serem usadas na análise. Como a regressão múl- 
tipla é uma técnica de dependência, o pesquisador deve 
especificar qual variável é a dependente e quais são as 
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independentes. Apesar de muitas vezes as opções parece- 
rem evidentes, o pesquisador sempre deve considerar três 
pontos que podem afetar qualquer decisão: teoria forte, 
erro de medida e erro de especificação. 


Teoria forte 

A seleção dos dois tipos de variáveis deve ser baseada 
principalmente em questões conceituais ou teóricas, mes- 
mo quando o objetivo é somente previsão. Os Capítulos 1 
e 10 discutem o papel da teoria em análise multivariada, 
e tais questões se aplicam muito à regressão múltipla. O 
pesquisador deve tomar decisões fundamentais sobre a 
seleção de variáveis, ainda que muitas opções e modos de 
programas estejam disponíveis para auxiliar na estimação 
do modelo. Se o pesquisador não exerce julgamento du- 
rante a seleção de variáveis, mas, em vez disso, (1) sele- 
ciona variáveis indiscriminadamente ou (2) permite que 
a seleção de uma variável independente seja sustentada 
apenas em bases empíricas, vários dos pressupostos bási- 
cos do desenvolvimento de modelos serão violados. 


Erro de medida 
A seleção de uma variável dependente muitas vezes é 
ditada pelo problema de pesquisa. Em todos os casos, o 
pesquisador deve estar a par do erro de medida, espe- 
cialmente na variável dependente. O erro de medida re- 
fere-se ao grau em que a variável é uma medida precisa 
e consistente do conceito em estudo. Se a variável usada 
como a medida dependente contiver um erro de medida 
substancial, então mesmo as melhores variáveis indepen- 
dentes poderão ser incapazes de atingir níveis aceitáveis 
de precisão preditiva. Apesar de o erro de medida poder 
surgir de várias fontes (ver Capítulo 1 para uma discussão 
mais detalhada), a regressão múltipla não dispõe de uma 
maneira direta de correção para níveis conhecidos de erro 
de medida para a variável dependente ou as independen- 
tes. 

O erro de medida problemático pode ser tratado por 
meio de duas abordagens: 


e Escalas múltiplas, como discutido nos Capítulos 1 e 3, em- 
pregam múltiplas variáveis para reduzir a confiança em 
qualquer variável isolada como a única representativa de 
um conceito. 

e Modelagem de equações estruturais (Capítulo 10) acomoda 
diretamente erro de medida na estimação de efeitos das va- 
riáveis independentes em qualquer relação de dependência 
especificada. 


Escalas múltiplas podem ser diretamente incorpora- 
das na regressão múltipla substituindo-se ou a variável 
dependente ou as independentes com os valores da escala 
múltipla, enquanto a modelagem de equações estruturais 
requer o uso de uma técnica inteiramente diferente geral- 
mente tida como mais difícil de implementar. Assim, esca- 
las múltiplas são recomendadas como a primeira escolha 
na correção de erro de medida onde for possível. 


Erro de especificação 
Talvez a questão mais problemática na seleção de variá- 
veis independentes seja o erro de especificação, o qual se 
refere à inclusão de variáveis irrelevantes ou à omissão 
de variáveis relevantes do conjunto de variáveis indepen- 
dentes. 

Ambos os tipos de erro de especificação podem ter 
impactos substanciais em qualquer análise de regressão, 
embora de maneiras muito diferentes: 


e Apesar de a inclusão de variáveis irrelevantes não viesar os 
resultados para as outras variáveis independentes, ela exer- 
ce algum impacto sobre a variável estatística de regressão. 
Primeiro, reduz a parcimônia do modelo, a qual pode ser 
crucial na interpretação dos resultados. Segundo, as variá- 
veis adicionais podem mascarar ou substituir os efeitos de 
variáveis mais úteis, especialmente se alguma forma seqien- 
cial de estimação de modelo for empregada (ver a discussão 
do estágio 4 para mais detalhes). Finalmente, as variáveis 
adicionais podem tornar o teste de significância estatística 
das variáveis independentes menos preciso e reduzir a signi- 
ficância estatística e prática da análise. 

e Dados os problemas associados ao acréscimo de variáveis 
irrelevantes, o pesquisador deve se preocupar com a exclu- 
são de variáveis relevantes? A resposta é definitivamente 
positiva, pois a exclusão de variáveis relevantes pode causar 
sérios vieses nos resultados e afetar negativamente qual- 
quer interpretação dos mesmos. No caso mais simples, as 
variáveis omitidas são não-correlacionadas com as variáveis 
incluídas, e o único efeito é reduzir a precisão preditiva ge- 
ral da análise. Quando existe correlação entre as variáveis 
omitidas e incluídas, os efeitos das variáveis incluídas se 
tornam mais viesados à medida que elas são correlaciona- 
das com as omitidas. Quanto maior a correlação, maior o 
viés. Os efeitos estimados para as variáveis incluídas ago- 
ra representam não apenas seus efeitos reais, mas também 
os efeitos que as variáveis incluídas compartilham com as 
variáveis omitidas. Isso pode conduzir a problemas sérios 
na interpretação do modelo e na avaliação da significância 
estatística e gerencial. 


O pesquisador deve ser cuidadoso na seleção das va- 
riáveis para evitar os dois tipos de erro de especificação. 
Talvez mais problemática seja a omissão de variáveis re- 


REGRAS PRÁTICAS 4-1 


Atendimento dos objetivos da regressão múltipla 


e Apenas a modelagem de equações estruturais (SEM) 
pode acomodar diretamente erro de medida, usando 
escalas múltiplas para diminuí-lo quando se emprega 
regressão múltipla. 


Quando em dúvida, inclua variáveis potencialmente 
irrelevantes (elas podem apenas confundir a 
interpretação) ao invés de possivelmente omitir 
uma variável relevante (o que pode viesar todas as 
estimativas de regressão). 
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levantes, uma vez que o efeito das variáveis não pode 
ser avaliado sem sua inclusão (ver Regras Práticas 4-1). 
Sua potencial influência em qualquer resultado aumenta 
a necessidade de apoio teórico e prático para todas as 
variáveis incluídas ou excluídas em uma análise de re- 
gressão múltipla. 


ESTÁGIO 2: PLANEJ AMENTO DE 
PESQUISA DE UMA ANALISE 
DE REGRESSAO MULTIPLA 


Adaptabilidade e flexibilidade são duas das principais ra- 
zões para o amplo uso de regressão múltipla em uma vas- 
ta variedade de aplicações. Como você verá nas seções a 
seguir, a regressão múltipla pode representar uma grande 
gama de relações de dependência. Ao fazer isso, o pesqui- 
sador incorpora três características: 


1. Tamanho da amostra. A regressão múltipla mantém os ní- 
veis necessários de poder estatístico e significância prática e 
estatística ao longo de muitos tamanhos de amostras. 

2. Elementos únicos da relação de dependência. Ainda que 
variáveis independentes sejam consideradas métricas e te- 
nham uma relação linear com a variável dependente, ambas 
as suposições podem ser mais flexíveis ou tolerantes, crian- 
do-se variáveis adicionais para representarem esses aspec- 
tos especiais da relação. 

3. Natureza das variáveis independentes. Regressão múltipla 
acomoda variáveis independentes métricas que são conside- 
radas como fixas por natureza, bem como aquelas com uma 
componente aleatória. 


Cada uma dessas características tem um papel chave 
na aplicação da regressão múltipla em muitos tipos de 
questões de pesquisa, ao mesmo tempo em que mantêm 
os níveis necessários de significância estatística e prática. 


Tamanho da amostra 


O tamanho da amostra em regressão múltipla talvez seja 
o elemento mais influente sob o controle do pesquisador 


no planejamento da análise. Os efeitos de tamanho da 
amostra são vistos mais diretamente no poder estatístico 
do teste de significância e na generalização do resultado. 
Ambas as questões são analisadas nas seções que se se- 
guem. 


Poder estatístico e tamanho da amostra 

O tamanho da amostra tem um impacto direto sobre a 
adequação e o poder estatístico da regressão múltipla. 
Amostras pequenas, geralmente caracterizadas por 
menos de 30 observações, são apropriadas para análise 
apenas por regressão simples com uma única variável 
independente. Mesmo nessas situações, apenas relações 
fortes podem ser detectadas com algum grau de certeza. 
Do mesmo modo, amostras muito grandes, de 1000 ob- 
servações ou mais, tornam os testes de significância esta- 
tística excessivamente sensíveis, muitas vezes indicando 
que quase qualquer relação é estatisticamente significan- 
te. Com amostras muito grandes, o pesquisador deve ga- 
rantir que o critério de significância prática seja atendido 
junto com a significância estatística. 


Níveis de poder em vários modelos de regressão. O po- 
der em regressão múltipla se refere à probabilidade de 
detectar-se como estatisticamente significante um nível 
específico de Rº ou um coeficiente de regressão em um 
nível de significância especificado para um dado tama- 
nho de amostra (ver Capítulo 1 para uma discussão mais 
detalhada). O tamanho da amostra tem um impacto não 
apenas na avaliação do poder de uma análise corrente, 
mas também na antecipação do poder estatístico de uma 
análise proposta. 

A Tabela 4-7 ilustra o efeito recíproco entre o tama- 
nho da amostra, o nível de significância (ot) escolhido e o 
número de variáveis independentes na detecção de um Rº 
significante. Os valores da tabela são o Rº mínimo que o 
tamanho de amostra especificado detecta como estatis- 
ticamente significante no nível alfa (ot) especificado com 
um poder (probabilidade) de 0,80. 


TABELA 4-7 Fº mínimo que pode ser tido como estatisticamente significante com um poder de 0,80 para 
diferentes números de variáveis independentes e tamanhos de amostras 


Nível de significância (o) = 0,01 
Número de variáveis independentes 


Nível de significância (o:) = 0,05 
Número de variáveis independentes 


Tamanho 
da amostra 2 5 10 20 2 5 10 20 
20 45 56 71 NA 39 48 64 NA 
50 23 29 36 49 19 23 29 42 
100 13 16 20 26 10 12 15 ei 
250 5 7 8 11 4 5 6 8 
500 3 3 4 6 3 4 5 9 
1.000 1 2 2 3 1 1 2 2 


NA = não aplicável 
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Por exemplo, se o pesquisador empregar cinco variáveis 
independentes, especificar um nível de significância de 
0,05 e estiver satisfeito em detectar o Rº em 80% das ve- 
zes em que ocorre (o que corresponde a um poder de 
0,80), uma amostra de 50 respondentes detectará valo- 
res Rº maiores ou iguais a 23%. Se a amostra aumentar 
para 100 respondentes, então os valores de Rº de 12% ou 
mais serão detectados. Entretanto, se 50 respondentes 
são tudo que está disponível e o pesquisador desejar um 
nível de significância de 0,01, a análise detectará valores 
Rº apenas maiores ou iguais a 29%. 


Exigências de tamanho de amostra para poder deseja- 
do. O pesquisador pode também considerar o papel do 
tamanho da amostra no teste de significância antes da co- 
leta dos dados. Se relações mais fracas são esperadas, o 
pesquisador pode fazer julgamentos com base em infor- 
mações factuais quanto ao tamanho necessário da amos- 
tra para detectar razoavelmente as relações, se elas exis- 
tirem. 


Por exemplo, a Tabela 4-7 demonstra que tamanhos de 
amostra de 100 detectam valores Rº muito pequenos 
(10% a 15%) com até 10 variáveis independentes e um 
nível de significância de 0,05. No entanto, se o tamanho 
da amostra nessas situações cai para 50 observações, o 
Rº mínimo que pode ser detectado dobra. 


O pesquisador também pode determinar o tamanho 
da amostra necessário para detectar efeitos para as variá- 
veis independentes individuais, dado o tamanho do efeito 
esperado (correlação), o nível o e o poder desejado. As 
computações possíveis são muito numerosas para serem 
apresentadas nesta discussão, e o leitor interessado pode 
consultar textos que tratam de análise do poder [5] ou 
um programa de computador para calcular o tamanho da 
amostra ou do poder em uma dada situação [3]. 


Resumo. O pesquisador sempre deve estar ciente do po- 
der antecipado de qualquer análise de regressão múltipla 
proposta. É crítico entender os elementos do planejamen- 
to da pesquisa, particularmente tamanho da amostra, que 
podem ser mudados para atender às exigências de uma 
análise aceitável [9]. 


Generalização e tamanho da amostra 

Além de seu papel na determinação do poder estatístico, 
o tamanho da amostra também afeta a generalização dos 
resultados pela proporção entre observações e variáveis 
independentes. Uma regra geral é que a razão jamais deve 
ficar abaixo de 5 para 1, o que significa que deve haver 
cinco observações para cada variável independente na 
variável estatística. Apesar de a proporção mínima ser 


de 5 para 1, o nível desejado está entre 15 e 20 observa- 
ções para cada variável independente. Quando esse nível 
é alcançado, os resultados devem ser generalizáveis se a 
amostra é representativa. No entanto, se um procedimen- 
to stepwise é empregado, o nível recomendado aumenta 
para 50 por 1, pois essa técnica seleciona apenas as rela- 
ções mais fortes dentro do conjunto de dados e sofre de 
uma maior tendência para se tornar específica da amostra 
[16]. Em casos nos quais a amostra disponível não atende 
a esses critérios, o pesquisador deve se certificar de vali- 
dar a generalização dos resultados. 


Definição de graus de liberdade. Se essa proporção ficar 
abaixo de 5 para 1, o pesquisador corre o risco de supera- 
justar a variável estatística à amostra, tornando os resul- 
tados demasiadamente específicos à amostra e assim per- 
dendo a generalização. Ao compreendermos o conceito 
de superajuste, precisamos lidar com a noção estatística 
de graus de liberdade. Em qualquer procedimento de esti- 
mação estatística, o pesquisador está fazendo estimativas 
de parâmetros a partir dos dados da amostra. No caso de 
regressão, os parâmetros são os coeficientes de regressão 
para cada variável independente e o termo constante. 
Como anteriormente descrito, os coeficientes de regres- 
são são os pesos usados no cálculo da variável estatística 
de regressão e indicam a contribuição de cada variável in- 
dependente ao valor previsto. O que é então a relação en- 
tre o número de observações e de variáveis? Examinemos 
rapidamente a estimação de parâmetros para um melhor 
discernimento sobre esse problema. 

Cada observação representa uma unidade separada e 
independente de informação (i.e., um conjunto de valores 
para cada variável independente). Em uma visão simplis- 
ta, o pesquisador poderia dedicar uma única variável a 
prever perfeitamente somente uma observação, uma se- 
gunda variável a outra observação, e assim por diante. Se 
a amostra é relativamente pequena, então a precisão pre- 
ditiva poderia ser bastante alta, e muitas das observações 
seriam perfeitamente previstas. Na verdade, se o número 
de parâmetros estimados (coeficientes de regressão e a 
constante) se iguala ao tamanho da amostra, previsão per- 
feita acontecerá mesmo que todos os valores de variáveis 
sejam números aleatórios. Tal cenário seria totalmente 
inaceitável e considerado como extremamente superajus- 
tado, pois os parâmetros estimados não têm generaliza- 
ção, mas se relacionam apenas com a amostra. Além disso, 
sempre que uma variável for acrescentada na equação de 
regressão, o valor Rº aumentará. 


Graus de liberdade como medida de generalização. O 
que acontece com a generalização quando o tamanho da 
amostra aumenta? Podemos perfeitamente prever uma 
observação com uma só variável, mas e quanto a todas as 
outras observações? Assim, o pesquisador está procuran- 
do pelo melhor modelo de regressão, um com a melhor 
precisão preditiva para a maior amostra (a mais genera- 
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lizável). O grau de generalização é representado pelos 
graus de liberdade, calculados como: 


Graus de liberdade (df) = Tamanho da amostra — 
Número de parâmetros estimados 


ou 


Graus de liberdade (df) = N — (Número de variáveis 
independentes + 1) 


Quanto mais graus de liberdade, mais generalizáveis 
são os resultados. Graus de liberdade aumentam em uma 
dada amostra reduzindo-se o número de variáveis inde- 
pendentes. Assim, a meta é conseguir a melhor precisão 
preditiva com o máximo de graus de liberdade. Em nosso 
exemplo anterior, onde o número de parâmetros estima- 
dos é igual ao tamanho da amostra, temos uma previsão 
perfeita, mas zero graus de liberdade! O pesquisador deve 
reduzir o número de variáveis independentes (ou aumen- 
tar o tamanho da amostra), diminuindo a precisão predi- 
tiva mas também aumentando os graus de liberdade. Não 
há diretrizes específicas para determinar quantos graus de 
liberdade deve-se ter, mas eles são indicativos da genera- 
lidade dos resultados e fornecem uma idéia do superajus- 
te de qualquer modelo de regressão, como se mostra nas 
Regras Práticas 4-2. 


Criação de variáveis adicionais 

A relação básica representada na regressão múltipla é a 
associação linear entre variáveis dependente e indepen- 
dentes com base na correlação produto-momento. Um 
problema frequentemente enfrentado por pesquisadores é 
o desejo de incorporar dados não-métricos, como sexo ou 
profissão, em uma equação de regressão. Contudo, como já 
discutimos, a regressão é limitada a dados métricos. Mais 
que isso, a falta de habilidade da regressão de diretamente 
modelar relações não-lineares pode restringir o pesquisa- 
dor quando ele enfrenta situações nas quais uma relação 
não-linear (por exemplo, em forma de U) é sugerida pela 
teoria ou detectada quando se examinam os dados. 


REGRAS PRÁTICAS 4-2 


Considerações sobre tamanho de amostra 


e Regressão simples pode ser efetiva com um tamanho 
de amostra de 20, mas manter poder a 0,80 em 
regressão múltipla requer uma amostra mínima de 50 
e, preferivelmente, 100 observações para a maioria das 
situações de pesquisa. 


A proporção mínima de observações por variáveis é 5:1, 
mas a proporção preferida é de 15:1 ou 20:1, o que deve 
então aumentar quando a estimação stepwise é usada. 
Maximizar os graus de liberdade melhora generalização 
e lida tanto com parcimônia do modelo quanto com 
preocupações com tamanho da amostra. 


Uso de transformações de variáveis 

Nessas situações, novas variáveis devem ser criadas por 
transformações, uma vez que a regressão múltipla é total- 
mente confiável ao se criarem novas variáveis no mode- 
lo para incorporar variáveis não-métricas ou representar 
efeitos diferentes de relações lineares. Também encon- 
tramos o uso de transformações discutidas no Capítulo 2 
como um meio para remediar violações de algumas supo- 
sições estatísticas, mas nosso propósito aqui é fornecer ao 
pesquisador uma maneira de modificar a variável depen- 
dente ou as independentes por uma entre duas razões: 


1. Melhorar ou modificar a relação entre variáveis dependente 
e independentes. 

2. Permitir o emprego de variáveis não-métricas na variável 
estatística de regressão. 


As transformações de dados podem ser baseadas em 
razões teóricas (transformações cuja adequação é sus- 
tentada na natureza dos dados) ou de origem nos dados 
(transformações estritamente sugeridas por um exame 
dos dados). Em qualquer caso, o pesquisador deve proce- 
der muitas vezes por tentativa e erro, avaliando constante- 
mente a melhoria versus a necessidade de transformações 
adicionais. Exploramos essas questões com discussões so- 
bre as transformações de dados que permitem à análise 
de regressão uma melhor representação dos dados reais 
e uma discussão da criação de variáveis para suplementa- 
rem as originais. 

Todas as transformações que descrevemos são facil- 
mente executáveis por comandos simples em todos os 
pacotes estatísticos populares. Apesar de nos concentrar- 
mos em transformações que podem ser computadas desse 
modo, há outros métodos mais sofisticados e complicados 
disponíveis (p.ex., ver Box e Cox [4]). 


Incorporação de dados não-métricos 

com variáveis dicotômicas 

Uma situação comum enfrentada por pesquisadores é o 
desejo de utilizar variáveis independentes não-métricas. 
Todavia, até aqui, todos os nossos exemplos assumiram 
medida métrica para variáveis independentes e dependen- 
te. Quando a variável dependente é medida como dicotô- 
mica (0, 1), tanto a análise discriminante como uma forma 
especializada de regressão (regressão logística), ambas 
discutidas no Capítulo 5, são adequadas. O que podemos 
fazer quando as variáveis independentes são não-métricas 
e têm duas ou mais categorias? O Capítulo 2 introduziu o 
conceito de variáveis dicotômicas, as quais podem atuar 
como variáveis independentes substitutas. Cada variável 
dicotômica representa uma categoria de uma variável in- 
dependente não-métrica, e qualquer variável não-métrica 
com k categorias pode ser representada por k — 1 variáveis 
dicotômicas. 


Codificação indicadora: o formato mais comum. Das 
duas formas de codificação de variáveis dicotômicas, a 
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mais comum é a codificação indicadora, na qual cada ca- 
tegoria da variável não-métrica é representada por 1 ou 0. 
Os coeficientes de regressão para as variáveis dicotômicas 
representam diferenças sobre a variável dependente para 
cada grupo de respondentes da categoria de referência 
(isto é, o grupo omitido que recebeu todos os zeros). Essas 
diferenças de grupos podem ser avaliadas diretamente, 
uma vez que os coeficientes estão nas mesmas unidades 
da variável dependente. 


Essa forma de codificação de variável dicotômica pode 
ser descrita como diferentes interceptos para os vários 
grupos, com a categoria de referência representada no 
termo constante do modelo de regressão (ver Figura 
4-3). Neste exemplo, uma variável não-métrica de três 
categorias é representada por duas variáveis dicotômi- 
cas (D, e D,), representando os grupos 1 e 2, sendo o 
grupo 3 a categoria de referência. Os coeficientes de re- 
gressão são 2,0 para D, e -3,0 para D,. Esses coeficientes 
se traduzem em três retas paralelas. O grupo de referên- 
cia (neste caso, o grupo 3) é definido pela equação de 
regressão com ambas as variáveis dicotômicas iguais a 
zero. A reta do grupo 1 está duas unidades acima da reta 
do grupo de referência. A reta do grupo 2 está três uni- 
dades abaixo da reta do grupo de referência 3. As retas 
paralelas indicam que as variáveis dicotômicas não mu- 
dam a natureza da relação, mas apenas fornecem dife- 
rentes interceptos entre os grupos. 


Essa forma de codificação é mais apropriada quando 
existe um grupo de referência lógico, como em um expe- 
rimento. Em qualquer momento em que a codificação por 
variável dicotômica for empregada, devemos estar cien- 
tes do grupo de comparação e lembrar que os coeficientes 
representam as diferenças em médias em relação a esse 


grupo. 


Codificação de efeitos. Um método alternativo de codi- 
ficação por variável dicotômica se chama codificação dos 
efeitos. É o mesmo que codificação indicadora, exceto 
pelo fato de que o grupo de comparação ou omitido (o 
grupo que recebe todos os zeros) recebe o valor —1 no lu- 
gar de O para as variáveis dicotômicas. Agora os coeficien- 
tes representam diferenças para qualquer grupo em relação 
à média de todos os grupos, e não em relação ao grupo 
omitido. Ambas as formas de codificação por variável di- 
cotômica dão os mesmos resultados preditivos, coeficiente 
de determinação e coeficientes de regressão para as variá- 
veis contínuas. As únicas diferenças estão na interpreta- 
ção dos coeficientes das variáveis dicotômicas. 


Representação de efeitos curvilíneos com polinômios 
Diversos tipos de transformações de dados são adequados 
para linearizar uma relação curvilínea. Abordagens dire- 
tas, discutidas no Capítulo 2, envolvem a modificação de 


valores por alguma transformação aritmética (p.ex., a raiz 
quadrada ou o logaritmo da variável). No entanto, tais 
transformações estão sujeitas às seguintes limitações: 


e Elas são aplicáveis somente em uma relação curvilínea sim- 
ples (uma relação com apenas um ponto de inflexão). 

e Elas não fornecem meios estatísticos para avaliar se o mo- 
delo curvilíneo ou linear é mais apropriado. 

e Elas acomodam apenas relações univariadas, e não a intera- 
ção entre variáveis, quando mais de uma variável indepen- 
dente está envolvida. 


Agora discutimos um meio para criar novas variáveis 
para modelar explicitamente as componentes curvilíneas 
da relação e lidar com cada limitação inerente às transfor- 
mações de dados. 


Especificação de um efeito curvilíneo. Transformações 
de potências de uma variável independente que acrescen- 
tam uma componente não-linear para cada potência adi- 
cional da variável independente são conhecidas como po- 
linômios. A potência de 1 (X') representa a componente 
linear e é a forma que discutimos até agora neste capítulo. 
A potência de 2, a variável ao quadrado (X”), representa a 
componente quadrática. Em termos gráficos, X represen- 
ta o primeiro ponto de inflexão. Uma componente cúbica, 
representada pela variável ao cubo (X)), acrescenta um 
segundo ponto de inflexão. Com essas variáveis e mesmo 
potências superiores, podemos acomodar relações mais 
complexas do que é possível apenas com transformações. 
Por exemplo, em um modelo de regressão simples, um 
modelo curvilíneo com um ponto de inflexão pode ser ex- 
presso pela equação 


F=ho+bX+bA/ 
onde 
b, = intercepto 
b X, = efeito linear de X, 


DX, E = efeito curvilíneo de X. : 


Apesar de poder ser acrescentado qualquer número 
de componentes não-lineares, o termo cúbico geralmente 
é a maior potência usada. Polinômios multivariados são 
criados quando a equação de regressão contém duas ou 
mais variáveis independentes. Seguimos o mesmo proce- 
dimento para criar os termos polinomiais como antes, mas 
também devemos criar um termo adicional, o termo de in- 
teração (X,X,), que é necessário para cada combinação de 
variável para representar completamente os efeitos mul- 
tivariados. Em termos gráficos, um polinômio multivaria- 
do de duas variáveis é retratado por uma superfície com 
um pico ou vale. Para os polinômios de ordem superior, 
a melhor forma de interpretação é obtida pelo gráfico da 
superfície a partir dos valores previstos. 


Interpretação de um efeito curvilíneo. Da mesma forma 
que ocorre com cada nova variável incluída na equação de 
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Equações de regressão com variáveis dicotômicas (D, e D,) 


Especificada 
Estimada 
Geral 
Grupo Específico 
Grupo 1 (D,=1,D,=0) 


Grupo 2 (D, =0, D, = 1) 


Grupo 3 (D, = 0, D,=0) 


Y=a+b,X+ bD, + baD, 


Y=2+1,2X+2D, -3D, 


Y=2+1,2X+2(1) 
Y=2+1,2X —3(1) 


Y=2+1,2X 


FIGURA 4-3 


regressão, podemos também fazer um teste estatístico di- 
reto das componentes não-lineares, o qual não é possível 
com transformações de dados. No entanto, multicolinea- 
ridade pode criar problemas na avaliação da significância 
estatística dos coeficientes individuais na medida em que 
o pesquisador deveria avaliar efeitos incrementais como 
uma medida de qualquer termo polinomial em um pro- 
cesso de três passos: 


1. Estimar a equação de regressão original. 

2. Estimar a relação curvilínea (equação original mais o termo 
polinomial). 

3. Avaliar a mudança em R”. Se for estatisticamente significan- 
te, então um efeito curvilíneo significante está presente. A 
atenção está no efeito incremental, e não na significância de 
variáveis individuais. 

Três relações (duas não-lineares e uma linear) são 
exibidas na Figura 4-4. Para fins de interpretação, o ter- 
mo quadrático positivo indica uma curva em forma de U, 
enquanto um coeficiente negativo indica uma curva em 
em forma de n. A utilização de um termo cúbico pode 
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representar curvas no formato de um S ou uma curva de 
crescimento muito facilmente, mas geralmente é melhor 
representar graficamente os valores para interpretar cor- 
retamente a forma real. 

Quantos termos devem ser acrescentados? A prática co- 
mum é começar com a componente linear e então acrescen- 
tar segiiencialmente polinômios de ordem superior até que 
a não-significância seja alcançada. O uso de polinômios, 
contudo, também apresenta problemas em potencial. Pri- 
meiro, cada termo adicional exige um grau de liberdade, o 
que pode ser particularmente restritivo em tamanhos pe- 
quenos de amostras. Essa limitação não ocorre com trans- 
formações de dados. Além disso, a multicolinearidade é 
introduzida pelos termos adicionais e torna o teste de sig- 
nificância estatística dos termos polinomiais inadequado. 
Em vez disso, o pesquisador deve comparar os valores Rº 
do modelo com termos lineares com o R” da equação com 
os termos polinomiais. Testar a significância estatística do 
R'incremental é o modo adequado de avaliar o impacto 
dos polinômios. 


172. Análise Multivariada de Dados 


30 


20 H 


10 


Quadrático positivo 


Linear 


Quadrático negativo 


(o) 


5 6 7 8 9 10 
X 


FIGURA 4-4 Representação polinomial de relações não-lineares. 


Representação de efeitos de interação ou moderadores 
As relações não-lineares discutidas anteriormente exigem 
a criação de uma variável adicional (p.ex., o termo qua- 
drado) para representar a variação do coeficiente angular 
da relação ao longo do intervalo da variável independen- 
te. Essa representação se concentra sobre a relação entre 
uma única variável independente e a variável dependente. 
Entretanto, o que acontece se uma relação variável inde- 
pendente-dependente é afetada por uma outra variável 
independente? Essa situação é chamada de efeito mode- 
rador, o qual ocorre quando a variável moderadora, uma 
segunda variável independente, muda a forma da relação 
entre uma outra variável independente e a dependente. 
Isso é também conhecido como um efeito de interação e é 
semelhante ao termo de interação encontrado em análise 
de variância e análise multivariada de variância (ver Capí- 
tulo 6 para mais detalhes sobre termos de interação). 


Exemplos de efeitos moderadores. O efeito moderador 
mais comum empregado em regressão múltipla é o quase 
moderador ou moderador bilinear, no qual o coeficiente 
angular da relação de uma variável independente (X,) 
muda ao longo de valores da variável moderadora (X,) 
[7,14]. 


Em nosso exemplo anterior de uso de cartões de crédito, 
considere que a renda familiar (X,) foi percebida como 
um moderador positivo da relação entre tamanho da 
família (X,) e uso de cartões de crédito (Y). Isso signi- 
fica que a variação esperada no uso de cartões de cré- 
dito baseada em tamanho da família (b,, o coeficiente 
de regressão para X,) poderia ser menor para famílias 
com rendas menores, e maior para famílias com rendas 
maiores. Sem o efeito moderador, consideramos que o 


11 12 13 14 


tamanho da família tinha um efeito constante sobre o 
número de cartões de crédito usados, mas o termo de 
interação nos diz que essa relação muda, dependendo do 
nível de renda familiar. Observe que isso não significa 
necessariamente que os efeitos do tamanho da família 
ou da renda familiar são por si mesmos sem importância, 
mas que o termo de interação complementa sua explica- 
ção do uso de cartões de crédito. 


Adição do efeito moderador. O efeito moderador é re- 
presentado em regressão múltipla por um termo muito 
semelhante aos polinômios descritos anteriormente para 
representar efeitos não-lineares. O termo moderador é 
uma variável composta formada pela multiplicação de X, 
pelo moderador X,, o qual entra na equação de regres- 
são. Na verdade, o termo não-linear pode ser visto como 
uma forma de interação, onde a variável independente 
“modera” a si própria e, portanto, o termo quadrado 
(X,X,). A relação moderada é representada como 


Y=b+bX,+b,X,+b;X,X, 


onde 


b, = intercepto 
b X, = efeito linear de X, 
bX = efeito linear de X, 
BX,X, = efeito moderador de X, sobre X, 


Por causa da multicolinearidade entre as variáveis an- 
tigas e as novas, uma abordagem semelhante para testar 
a significância de efeitos polinomiais (não-lineares) é em- 
pregada. Para determinar se o efeito moderador é signifi- 
cante, o pesquisador segue um processo de três passos: 
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1. Estimar a equação original (não-moderada). 

2. Estimar a relação moderada (equação original mais a variá- 
vel moderadora). 

3. Avaliar a mudança em Rº: se for estatisticamente significan- 
te, então um efeito moderador significante se faz presente. 
Apenas o efeito incremental é avaliado, não a significância 
das variáveis individuais. 


Interpretação dos efeitos moderadores. A interpre- 
tação dos coeficientes de regressão muda um pouco em 
relações moderadas. O coeficiente b, o efeito moderador, 
indica a variação por unidade no efeito de X, quando X, 
varia. Os coeficientes b,e b,agora representam os efeitos 
de X,e X,, respectivamente, quando a outra variável in- 
dependente é zero. Na relação não-moderada, o coefi- 
ciente b, representa o efeito de X, ao longo de todos os 
níveis de X,, e o mesmo ocorre para b,. Assim, em re- 
gressão não-moderada, os coeficientes de regressão b, e 
b, têm médias calculadas ao longo dos níveis das outras 
variáveis independentes, enquanto que, em uma relação 
moderada, eles são separados das outras variáveis inde- 
pendentes. Para determinar o efeito total de uma variável 
independente, os efeitos separados e moderados devem 
ser combinados. O efeito geral de X, para qualquer valor 
de X, pode ser determinado substituindo-se o valor X,na 
seguinte equação: 


Dootal = b, E DX, 


Por exemplo, considere que uma regressão moderada 
tenha resultado nos seguintes coeficientes: b, = 2,0 e b; 
= 0,5. Se o valor de X, varia de 1 a 7, o pesquisador pode 
calcular o efeito total de X, para qualquer valor de X,. 
Quando X, é 3, o efeito total de X, é 3,5 [2,0 + 0,5(3)]. 
Quando X, aumenta para 7, o efeito total de X, passa a 
ser 5,5 [2,0 + 0,5(7)]. 


Podemos ver o efeito moderador em funcionamento, 
fazendo a relação de X, com a variável dependente variar, 
dado o nível de X,. Excelentes discussões sobre relações 
moderadas em regressão múltipla estão disponíveis em 
várias fontes [5,7,14]. 


Resumo 

A criação de novas variáveis fornece ao pesquisador 
grande flexibilidade na representação de uma vasta gama 
de relações em modelos de regressão (ver Regras Práti- 
cas 4-3). Ainda, muito frequentemente o desejo de um 
melhor ajuste de modelo conduz à inclusão dessas rela- 
ções especiais sem apoio teórico. Nesses casos, o pesqui- 
sador está correndo um risco muito maior de encontrar 
resultados com pouca ou nenhuma generalização. Em 
vez disso, ao usar essas variáveis adicionais, ele deve ser 
guiado pela teoria apoiada por análise empírica. Desse 
modo, tanto a significância prática quanto a estatística 
podem ser alcançadas. 


Previsores de efeitos fixos versus aleatórios 


Os exemplos de modelos de regressão discutidos até aqui 
consideram que os níveis das variáveis independentes são 
fixos. Por exemplo, se queremos saber o impacto sobre 
preferência de três níveis de adoçante em um refrigerante, 
produzimos três diferentes tipos de bebida e pedimos a um 
grupo de pessoas para experimentar cada um. Em seguida 
podemos prever o índice de preferência sobre cada refrige- 
rante usando o nível de adoçante como a variável indepen- 
dente. Fixamos o nível de adoçante e estamos interessados 
em seus efeitos em tais níveis. Não consideramos os três ní- 
veis como uma amostra aleatória para um grande número 
de possíveis níveis de adoçante. 

Uma variável independente aleatória é uma na qual os 
níveis são selecionados ao acaso. Quando se usa uma va- 
riável independente aleatória, o interesse não é apenas nos 
níveis examinados, mas na maior população de possíveis ní- 
veis de variável independente a partir da qual selecionamos 
uma amostra. 

A maioria dos modelos de regressão baseados em da- 
dos de pesquisa são modelos de efeitos aleatórios. Como 
ilustração, um levantamento foi conduzido para auxiliar na 
avaliação da relação entre idade do respondente e frequên- 
cia de visitas a médicos. A variável independente “idade do 
respondente” foi aleatoriamente escolhida a partir da popu- 
lação, e a inferência relativa à população é de preocupação, 
e não apenas conhecimento dos indivíduos na amostra. 

Os procedimentos de estimação para modelos usando 
ambos os tipos de variáveis independentes são os mesmos 
exceto pelos termos de erro. Nos modelos de efeitos alea- 
tórios, uma porção do erro aleatório surge da amostragem 
das variáveis independentes. No entanto, os procedimentos 
estatísticos baseados no modelo fixado são bastante robus- 
tos, e assim usar a análise estatística como se você estivesse 
lidando com um modelo fixo (como a maioria dos pacotes 
de análise consideram) pode ainda ser apropriado como 
uma aproximação razoável. 


REGRAS PRÁTICAS 4-3 


Transformações de variáveis 


Variáveis não-métricas só podem ser incluídas em uma 
análise de regressão pela criação de variáveis dicotômicas. 
Variáveis dicotômicas só podem ser interpretadas em 
relação a sua categoria de referência. 

Adicionar um termo polinomial extra representa outro 
ponto de inflexão na relação curvilínea. 


Polinômios quadráticos e cúbicos são geralmente 
suficientes para representar a maioria das relações 
curvilíneas. 


A avaliação da significância de um termo polinomial 
ou de interação se consegue com a avaliação do Rº 
incremental, e não a significância de coeficientes 
individuais, devido à alta multicolinearidade. 
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ESTÁGIO 3: SUPOSIÇÕES EM ANÁLISE 
DE REGRESSÃO MÚLTIPLA 


Já mostramos como que melhoramentos na previsão da 
variável dependente são possíveis acrescentando-se variá- 
veis independentes e mesmo transformando-as para re- 
presentar aspectos da relação que não são lineares. Con- 
tudo, para isso, devemos fazer várias suposições sobre as 
relações entre as variáveis dependente e independentes 
que afetam o procedimento estatístico (mínimos quadra- 
dos) usado para regressão múltipla. Nas seções a seguir, 
discutimos testes para as suposições e ações corretivas a 
realizar no caso de ocorrerem violações. 

A questão básica é se, no curso do cálculo dos coefi- 
cientes de regressão e de previsão da variável dependente, 
as suposições da análise de regressão são atendidas. Os er- 
ros na previsão são um resultado de uma ausência real de 
uma relação entre as variáveis, ou eles são causados por 
algumas características dos dados não acomodadas pelo 
modelo de regressão? As suposições a serem examinadas 
estão em quatro áreas: 


1. Linearidade do fenômeno medido 

« Variância constante dos termos de erro 

» Independência dos termos de erro 

- Normalidade da distribuição dos termos de erro 


Bwin 


Avaliação de variáveis individuais 
versus a variável estatística 


Antes de abordarmos as suposições individuais, devemos 
primeiramente entender que as suposições inerentes à 
análise de regressão múltipla se aplicam às variáveis in- 
dividuais (dependente e independentes) e à relação como 
um todo. O Capítulo 2 examinou os métodos disponíveis 
para avaliar as suposições para variáveis individuais. Na 
regressão múltipla, uma vez que a variável estatística te- 
nha sido determinada, ela atua coletivamente na previ- 
são da variável dependente, a qual necessita de avaliação 
das suposições não apenas para variáveis individuais, mas 
também para a variável estatística em si. Esta seção se con- 
centra no exame da variável estatística e da sua relação 
com a variável dependente para atender às suposições 
da regressão múltipla. Essas análises, na verdade, devem 
ser executadas depois que o modelo de regressão tenha 
sido estimado no estágio 4. Logo, os testes das suposições 
devem ocorrer não apenas nas fases iniciais da regressão, 
mas também depois que o modelo foi estimado. 

Uma questão comum é colocada por muitos pesquisa- 
dores: por que examinar as variáveis individuais quando po- 
demos simplesmente examinar a variável estatística e evitar 
o tempo e o esforço despendidos na avaliação de variáveis 
individuais? A resposta se apóia na compreensão consegui- 
da no exame de variáveis individuais em duas áreas: 


e A violação de suposições para variáveis individuais fez suas 
relações serem mal representadas? 


e Quais são as fontes e ações corretivas para qualquer viola- 
ção de suposições para a variável estatística? 


Somente com um detalhado exame das variáveis in- 
dividuais o pesquisador será capaz de abordar essas duas 
questões importantes. Se apenas a variável estatística 
for avaliada, então o pesquisador não apenas terá pouca 
idéia de como corrigir eventuais problemas, como, talvez 
mais importante ainda, não saberá quais oportunidades 
foram perdidas para melhores representações das variá- 
veis individuais e, em última instância, da variável esta- 
tística. 


Métodos de diagnóstico 


A principal medida de erro de previsão para a variável 
estatística é o resíduo — a diferença entre os valores ob- 
servados e previstos para a variável dependente. Quan- 
do se examinam resíduos, recomenda-se alguma forma 
de padronização, pois isso torna os resíduos diretamente 
comparáveis. (Em sua forma original, valores previstos 
maiores naturalmente têm resíduos maiores.) A forma 
mais amplamente usada é o resíduo estudantizado, cujos 
valores correspondem a valores t. Essa correspondência 
torna muito fácil avaliar a significância estatística de resí- 
duos particularmente grandes. 

A representação gráfica dos resíduos versus as variá- 
veis independentes ou previstas é um método básico para 
identificar violações de suposições para a relação geral. No 
entanto, o emprego de gráficos de resíduos depende de 
várias considerações-chave: 


e O gráfico de resíduo mais comum envolve os resíduos 
(r;) versus os valores dependentes previstos (Y,). Para 
um modelo de regressão simples, os resíduos podem ser 
representados graficamente em relação à variável depen- 
dente ou à independente, uma vez que elas estão direta- 
mente relacionadas. No entanto, em regressão múltipla, 
apenas os valores dependentes previstos representam o 
efeito total da variável estatística de regressão. Assim, a 
menos que a análise de resíduo pretenda se concentrar 
em apenas uma única variável, as variáveis dependentes 
previstas são usadas. 

e Violações de cada suposição podem ser identificadas por pa- 
drões específicos dos resíduos. A Figura 4-5 contém vários 
gráficos de resíduos que tratam das suposições básicas dis- 
cutidas nas seções a seguir. Um gráfico de especial interesse 
é o gráfico nulo (Figura 4-5a), o gráfico de resíduos quando 
todas as suposições são atendidas. O gráfico nulo mostra os 
resíduos que ocorrem aleatoriamente, com dispersão re- 
lativamente igual em torno de zero e nenhuma tendência 
forte para ser maior ou menor que zero. Do mesmo modo, 
nenhum padrão é encontrado para valores grandes versus 
pequenos da variável independente. Os demais gráficos de 
resíduos serão usados para ilustrar métodos para exame de 
violações das suposições inerentes à análise de regressão. 
Nas seções a seguir examinamos uma série de testes estatís- 
ticos que podem complementar o exame visual dos gráficos 
de resíduos. 
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FIGURA 4-5 Análise gráfica de resíduos. 


Linearidade do fenômeno 


A linearidade da relação entre variáveis dependente e in- 
dependentes representa o grau em que a variação na variá- 
vel dependente é associada com a variável independente. 
O coeficiente de regressão é constante no intervalo de va- 
lores da variável independente. O conceito de correlação é 
baseado em uma relação linear, o que a torna uma questão 
crucial na análise de regressão. A linearidade de qualquer 
relação bivariada é facilmente examinada por meio de grá- 
ficos de resíduos. A Figura 4-5b mostra um padrão típico 
de resíduos que indicam a existência de uma relação não- 
linear não representada no presente modelo. Qualquer 
padrão curvilíneo consistente nos resíduos indica que uma 
ação corretiva aumentará a precisão preditiva do modelo, 
bem como a validade dos coeficientes estimados. Ações 
corretivas podem assumir uma entre três formas: 


e Transformações de dados (p.ex., logaritmo, raiz quadrada 
etc.) de uma ou mais variáveis independentes para conse- 
guir linearidade são discutidas no Capítulo 2 [10]. 

e Inclusão direta de relações não-lineares no modelo de re- 
gressão, como através da criação de termos polinomiais dis- 
cutida no estágio 2. 

e Uso de métodos especializados, como a regressão não-linear 
especificamente elaborada para acomodar os efeitos curvi- 
líneos de variáveis independentes ou relações não-lineares 
mais complexas. 


Identificação de variáveis independentes para ação 
Como determinamos quais variáveis independentes de- 
vem ser selecionadas para ação corretiva? Em regressão 
múltipla com mais de uma variável independente, um exa- 
me dos resíduos mostra somente os efeitos combinados 
de todas as variáveis independentes, mas não podemos 
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examinar qualquer variável independente separadamente 
em um gráfico de resíduos. Para fazer isso, utilizamos o 
que chamamos de gráficos de regressão parcial, os quais 
mostram a relação de uma única variável independente 
com a dependente, controlando os efeitos das demais va- 
riáveis independentes. Como tal, o gráfico de regressão 
parcial retrata a relação única entre a variável dependente 
e cada variável independente. Ele difere dos gráficos de 
resíduos já discutidos, pois a reta que passa pelo centro 
dos pontos, que era horizontal nos gráficos anteriores (ver 
Figura 4-5), agora tem inclinação para cima ou para baixo, 
dependendo de o coeficiente de regressão para aquela va- 
riável independente ser positivo ou negativo. 

O exame das observações em torno dessa reta é feito 
exatamente como antes, mas agora o padrão curvilíneo 
indica uma relação não-linear entre uma variável inde- 
pendente específica e a variável dependente. Esse método 
é mais útil quando diversas variáveis independentes estão 
envolvidas, já que podemos dizer quais variáveis especí- 
ficas violam a suposição de linearidade e aplicar as ações 
corretivas necessárias apenas a elas. Além disso, a identi- 
ficação de observações atípicas ou influentes se torna mais 
fácil com base em uma variável independente por vez. 


Variância constante do termo de erro 


A presença de variâncias desiguais (heteroscedasticidade) 
é uma das violações mais comuns de suposições. O diag- 
nóstico é feito com gráficos de resíduos ou testes estatísti- 
cos simples. A representação gráfica de resíduos (estudan- 
tizados) versus os valores dependentes previstos e a sua 
comparação com o gráfico nulo (ver Figura 4-5a) mostra 
um padrão consistente se a variância não for constante. 
Talvez o padrão mais comum seja a forma triangular em 
qualquer direção (Figura 4-5c). Um padrão em forma de 
diamante (Figura 4-5d) pode ser esperado no caso de per- 
centagens nas quais se espera mais variação no meio do 
intervalo, em vez das bordas. Muitas vezes, diversas vio- 
lações ocorrem simultaneamente, como não-linearidade e 
heteroscedasticidade (Figura 4-5h). Ações corretivas para 
uma das violações fregiientemente corrigem problemas 
em outras áreas também. 

Todo programa computacional estatístico dispõe de 
testes estatísticos para heteroscedasticidade. Por exem- 
plo, SPSS fornece o teste Levene para homogeneidade de 
variância, o qual mede a igualdade de variâncias para um 
par de variáveis. Seu uso é particularmente recomendado 
porque é menos afetado por desvios da normalidade, ou- 
tro problema comum em regressão. 

Se ocorrer heteroscedasticidade, duas ações corretivas 
estão disponíveis. Se for possível atribuir a violação a uma 
única variável independente através da análise de gráfi- 
cos de resíduos discutida anteriormente, o procedimento 
de mínimos quadrados ponderados (com pesos) poderá 
ser empregado. Não obstante, mais diretas e mais fáceis 


são várias transformações de estabilização de variância 
discutidas no Capítulo 2, que permitem que as variáveis 
transformadas exibam homocedasticidade (igualdade de 
variância) e sejam diretamente usadas em nosso modelo 
de regressão. 


Independência dos termos de erro 


Assumimos em regressão que cada valor previsto é inde- 
pendente, o que significa que o valor previsto não está re- 
lacionado com qualquer outra previsão; ou seja, eles não 
são seqienciados por qualquer variável. Podemos identi- 
ficar melhor tal ocorrência fazendo o gráfico de resíduos 
em relação a qualquer variável sequencial possível. Se os 
resíduos forem independentes, o padrão deverá parecer 
aleatório e semelhante ao gráfico nulo de resíduos. As vio- 
lações serão identificadas por um padrão consistente nos 
resíduos. A Figura 4-Se exibe um gráfico de resíduos que 
mostra uma associação entre os resíduos e o tempo, uma 
variável sequencial comum. Um outro padrão frequente 
é mostrado na Figura 4-5f. Ele ocorre quando as condi- 
ções básicas do modelo mudam, mas não estão incluídas 
no modelo. Por exemplo, vendas de trajes de banho são 
medidas mensalmente durante 12 meses, com duas esta- 
ções de inverno versus uma estação de verão, ainda que 
nenhum indicador sazonal seja estimado. O padrão re- 
sidual mostrará resíduos negativos para os meses de in- 
verno versus resíduos positivos para os meses de verão. 
Transformações de dados, como as primeiras diferenças 
em um modelo de séries temporais, inclusão de variáveis 
indicadoras, ou modelos de regressão especialmente for- 
mulados, podem tratar dessa violação se ela ocorrer. 


Normalidade da distribuição dos termos de erro 


Talvez a violação de suposição mais frequentemente en- 
contrada seja a não-normalidade das variáveis indepen- 
dentes ou dependente ou ambas [13]. O diagnóstico mais 
simples para o conjunto de variáveis independentes na 
equação é um histograma de resíduos, com uma verifica- 
ção visual para uma distribuição que se aproxima da nor- 
mal (ver Figura 4-5g). Apesar de atraente por sua simpli- 
cidade, esse método é especialmente difícil em amostras 
menores, onde a distribuição é mal formada. Um método 
melhor é o uso de gráficos de probabilidade normal. Eles 
diferem dos gráficos de resíduos no sentido de que os re- 
síduos padronizados são comparados com a distribuição 
normal. A distribuição normal forma uma reta diagonal, 
e os resíduos graficamente representados são comparados 
com a diagonal. Se uma distribuição for normal, a reta re- 
sidual se aproximará da diagonal. O mesmo procedimento 
pode comparar as variáveis dependente ou independentes 
separadamente com a distribuição normal [6]. O Capítulo 
2 fornece uma discussão mais detalhada sobre a interpre- 
tação de gráficos de probabilidade normal. 
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Resumo 


A análise de resíduos, seja com gráficos de resíduos ou 
testes estatísticos, fornece um conjunto simples, mas po- 
deroso, de ferramentas analíticas para o exame da ade- 
quação de nosso modelo de regressão. No entanto, muito 
frequentemente essas análises não são feitas e as violações 
de suposições são mantidas intactas. Assim, os usuários 
dos resultados não estão cientes das imprecisões poten- 
ciais que podem estar presentes, as quais variam de testes 
inadequados da significância de coeficientes (mostrando 
significância onde não existe ou o contrário) até previsões 
viesadas e imprecisas da variável dependente. Recomen- 
damos muito que esses métodos sejam aplicados a cada 
conjunto de dados e cada modelo de regressão (ver Regras 
Práticas 4-4). A aplicação das ações corretivas, especial- 
mente as transformações dos dados, aumenta a confiança 
nas interpretações e previsões da regressão múltipla. 


ESTÁGIO 4: ESTIMAÇÃO DO MODELO 
DE REGRESSAO E AVALIAÇÃO DO 
AJUSTE GERAL DO MODELO 


Após ter especificado os objetivos da análise de regressão, 
selecionado as variáveis dependente e independentes, 
abordado as questões de planejamento da pesquisa e ava- 
liado se as variáveis atendem às suposições da regressão, 
o pesquisador agora está pronto para estimar o modelo de 
regressão e avaliar a precisão preditiva geral das variáveis 
independentes (ver Figura 4-6). Neste estágio, o pesquisa- 
dor deve cumprir três tarefas básicas: 


1. Selecionar um método para especificar o modelo de regres- 
são a ser estimado. 

2. Avaliar a significância estatística do modelo geral na previ- 
são da variável dependente. 

3. Determinar se alguma das observações exerce uma influên- 
cia indevida nos resultados. 


REGRAS PRÁTICAS 4-4 


Avaliação das suposições estatísticas 


e Teste de suposições deve ser feito não apenas para a 
variável dependente e cada variável independente, mas 
também para a variável estatística 
Análises gráficas (i.e., gráficos de regressão parcial, de 


resíduos e de probabilidade normal) são os métodos 
mais amplamente usados de avaliação de suposições 
para a variável estatística 

Ações corretivas para problemas encontrados 

na variável estatística devem ser realizadas pela 
modificação de uma ou mais variáveis independentes, 
como descrito no Capítulo 2 


Seleção de uma técnica de estimação 


Na maioria dos casos de regressão múltipla, o pesquisa- 
dor tem várias possíveis variáveis independentes que po- 
dem ser escolhidas para inclusão na equação de regressão. 
Algumas vezes, o conjunto de variáveis independentes é 
especificado exatamente e o modelo de regressão é essen- 
cialmente usado em uma abordagem confirmatória. Em 
outros casos, o pesquisador pode usar a técnica de estima- 
ção para escolher algumas variáveis em um conjunto de 
variáveis independentes com métodos de busca segiien- 
cial ou combinatorial. Cada um é planejado para ajudar 
o pesquisador a encontrar o “melhor” modelo de regres- 
são. Essas três abordagens para especificar o modelo de 
regressão são discutidas a seguir. 


Especificação confirmatória 

A abordagem mais simples, mas talvez a mais exigente, 
para especificar o modelo de regressão é empregar uma 
perspectiva confirmatória quando o pesquisador especi- 
fica completamente o conjunto de variáveis independen- 
tes a serem incluídas. Assim como na comparação com as 
abordagens específicas a serem discutidas a seguir, o pes- 
quisador tem total controle sobre a seleção de variáveis. 
Ainda que a especificação confirmatória seja conceitual- 
mente simples, o pesquisador é completamente responsá- 
vel pelas comparações entre mais variáveis independentes 
e maior precisão preditiva versus parcimônia do modelo e 
explicação concisa. Particularmente problemáticos são er- 
ros de especificação de omissão ou inclusão. Orientações 
para o desenvolvimento de modelos são discutidas nos 
Capítulos 1 e 10. O pesquisador deve evitar ser guiado por 
informação empírica e procurar confiar significativamente 
em justificativa teórica para uma abordagem verdadeira- 
mente confirmatória. 


Métodos de busca segiiencial 

Em visível contraste com o método anterior, os méto- 
dos de busca sequencial têm em comum a abordagem 
geral de estimar a equação de regressão considerando 
um conjunto de variáveis definidas pelo pesquisador e 
então seletivamente acrescentar ou eliminar variáveis 
até que alguma medida de critério geral seja alcançada. 
Essa técnica fornece um método objetivo para selecio- 
nar variáveis que maximiza a previsão ao mesmo tempo 
que emprega o menor número de variáveis. Dois tipos 
de abordagens são: (1) estimação stepwise e (2) adição 
forward e eliminação backward. Em cada tratamento, 
as variáveis são individualmente avaliadas quanto à 
sua contribuição à previsão da variável dependente e 
acrescentadas ao modelo de regressão ou eliminadas 
do mesmo com base em sua contribuição relativa. O 
procedimento por etapas (stepwise) é discutido e então 
contrastado com os procedimentos de adição forward e 
eliminação backward. 
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Do 
estágio 
3 


Estágio 4 


Selecionar uma técnica de estimação 


O pesquisador deseja (1) especificar o modelo 
de regressão ou (2) usar um procedimento de 
regressão que seleciona as variáveis 

independentes para otimizar previsão? 


(1) Especificação do analista 
Especificações do 
modelo de regressão 


pelo pesquisador Método de busca sequencial | 
l 


< Estimação forward/backward 
Estimação stepwise 
Abordagem combinatorial 
Todos-os-possíveis- 
subconjuntos 


(2) Procedimento para seleção 


Vá para o 
estágio 2: 
“Criação de 
variáveis 
adicionais” 


A variável estatística de regressão satisfaz N 
as suposições da análise de regressão? Não 


T 
Sim 


) 


Examinar significância estatística e prática 


Coeficiente de determinação 
Coeficiente ajustado de determinação 
Erro padrão da estimativa 
Significância estatística de coeficientes de regressão 


Sim 
Elimine observações 


influentes da 
amostra 


Identificar observações influentes 


Há algumas observações determinadas 


como influentes e que requerem eliminação 
da análise? 


Não 


| 


Estágio 5 Interpretar a variável estatística de regressão 

Avaliar a equação de previsão com os 
coeficientes de regressão 

Avaliar a importância relativa das variáveis 
independentes com os coeficientes beta 

Avaliar a multicolinearidade e seus efeitos 


Estágio 6 Validar os resultados 


Análise de amostras particionadas 
Estatística PRESS 


FIGURA 4-6 Estágios 4-6 do diagrama de decisão da regressão múltipla. 
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Selecionar variável independente inicial 


Sim 


Escolher variável independente 


que tem a maior correlação 
com a variável dependente 


A variação percentual 
explicada é estatisticamente 
significante? Não 


Sim 
Selecionar variável 
independente adicional 


Y 


A variância explicada por todas 
as variáveis é agora significante? 
Avaliar com testes F parciais 
para cada variável no 
modelo de regressão 


Fr Sim 


Não 
Dispensar variáveis 
não-significantes 


FIGURA 4-7 Fluxograma do método de estimação stepwise. 


Estimação stepwise. A estimação stepwise talvez seja 
a abordagem sequencial mais comum para a seleção de 
variáveis. Ela permite ao pesquisador examinar a con- 
tribuição de cada variável independente para o modelo 
de regressão. Cada variável é considerada para inclusão 
antes do desenvolvimento da equação. A variável inde- 
pendente com a maior contribuição é acrescentada em um 
primeiro momento. Variáveis independentes são então 
selecionadas para inclusão, com base em sua contribuição 
incremental sobre as variáveis já presentes na equação. O 
procedimento stepwise é ilustrado na Figura 4-7. As ques- 
tões específicas em cada estágio são as seguintes: 


1. Começar com o modelo de regressão simples selecionando 
a variável independente que é a mais fortemente correlacio- 
nada com a variável dependente. A equação seria Y = b, + 
DX. 

2. Examinar os coeficientes de correlação parcial para en- 
contrar uma variável independente adicional que explique 
a maior parte estatisticamente significante da variância não 


Há outras variáveis independentes 
disponíveis que fazem 
uma contribuição 
estatisticamente significante? 


Nenhuma previsão possível 


com regressão múltipla 


Não 
Examinar equação 
preditiva final 


Y 


Examinar adequação 


explicada (erro) remanescente da primeira equação de re- 
gressão. 

3. Recalcular a equação de regressão usando as duas variá- 
veis independentes e examinar o valor parcial F para a 
variável original no modelo para ver se esta ainda faz uma 
contribuição significante, dada a presença da nova variável 
independente. Se não for o caso, eliminar a variável. Essa 
habilidade de eliminar variáveis já no modelo diferencia o 
modelo stepwise dos modelos de adição forward/eliminação 
backward. Se a variável original ainda fizer uma contribui- 
ção significante, a equação será Y = b,+ b,X, + b,X,. 

4. Continuar esse procedimento examinando todas as variáveis 
independentes não-presentes no modelo para determinar se 
alguma faria uma adição estatisticamente significante para a 
equação corrente e, assim, deveria ser incluída em uma equa 
ção revisada. Se uma nova variável independente é incluída, 
examinar todas as variáveis independentes previamente no 
modelo para julgar se elas devem ser mantidas. 

5. Continuar adicionando variáveis independentes até que ne- 
nhuma das candidatas remanescentes para inclusão possa 
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contribuir em melhora estatisticamente significante na preci- 
são preditiva. Esse ponto acontece quando todos os coeficien- 
tes de regressão parcial remanescentes são não-significantes. 


Um viés potencial no procedimento stepwise resulta 
da consideração de apenas uma variável para seleção por 
vez. Suponha que as variáveis X,e X, explicassem juntas 
uma parte significante da variância (cada uma, dada a 
presença da outra), mas nenhuma fosse significante por si 
mesma. Nessa situação, nenhuma seria considerada para 
o modelo final. Além disso, como é discutido adiante, 
multicolinearidade entre as variáveis independentes pode 
afetar substancialmente todos os métodos de estimação 
sequencial. 


Adição forward e eliminação backward. Os procedi- 
mentos de adição forward e eliminação backward são 
processos de tentativa e erro para encontrar as melhores 
estimativas de regressão. O modelo de adição forward é 
semelhante ao procedimento stepwise, no sentido de que 
ele constrói a equação de regressão começando com uma 
única variável independente, enquanto a eliminação ba- 
ckward começa com uma equação de regressão incluindo 
todas as variáveis independentes e então elimina variáveis 
independentes que não contribuem significativamente. A 
principal distinção da abordagem stepwise em relação aos 
procedimentos de adição forward e eliminação backward 
é sua habilidade de acrescentar ou eliminar variáveis em 
cada estágio. Uma vez que uma variável é acrescentada ou 
eliminada nos esquemas de adição forward ou elimina- 
ção backward, a ação não pode ser revertida em um está- 
gio posterior. Assim, a habilidade do método stepwise de 
acrescentar e eliminar faz dele o procedimento preferido 
para a maioria dos pesquisadores. 


Advertências sobre os métodos de busca segiiencial. Para 
muitos pesquisadores, os métodos de busca segiiencial 
parecem a solução perfeita para o dilema encontrado na 
abordagem confirmatória para atingir o poder preditivo 
máximo com apenas as variáveis que contribuem de ma- 
neira estatisticamente significante. Entretanto, na seleção 
de variáveis para inclusão na variável estatística de regres- 
são, três aspectos críticos afetam sensivelmente a equação 
de regressão resultante. 


1. A multicolinearidade entre variáveis independentes tem 
substancial impacto sobre a especificação final do modelo. 
Examinemos a situação com duas variáveis independentes 
altamente correlacionadas que têm correlações quase iguais 
com a variável dependente. O critério para inclusão ou eli- 
minação nessas abordagens é maximizar o poder preditivo 
incremental da variável adicional. Se uma dessas variáveis 
entrar no modelo de regressão, será muito improvável que 
a outra variável também entre, pois essas variáveis são al- 
tamente correlacionadas e existe pouca variância individual 
para cada variável separadamente (ver a discussão adiante 
sobre multicolinearidade). Por essa razão, o pesquisador 
deve avaliar os efeitos da multicolinearidade na interpre- 
tação do modelo examinando não apenas a equação de re- 


gressão final, mas também as correlações diretas de todas 
as variáveis independentes potenciais. Isso ajuda o pesqui- 
sador a evitar concluir que as variáveis independentes que 
não entram no modelo não têm importância quando, na 
realidade, elas estão altamente relacionadas com a variável 
dependente, mas também correlacionadas com variáveis já 
presentes no modelo. Apesar de as abordagens de busca 
sequencial maximizarem a habilidade preditiva do modelo 
de regressão, o pesquisador deve ser muito cuidadoso ao 
usar tais métodos para estabelecer o impacto de variáveis 
independentes sem considerar multicolinearidade entre va- 
riáveis independentes. 

2. Todos os métodos de busca seqiencial criam uma perda 
de controle para o pesquisador. Ainda que o pesquisador 
especifique as variáveis a serem consideradas para a variá- 
vel estatística de regressão, é a técnica de estimação, inter- 
pretando os dados empíricos, que especifica o modelo de 
regressão final. Em muitos casos, complicações como mul- 
ticolinearidade podem resultar em um modelo de regressão 
final que atinge os mais altos níveis de precisão preditiva, 
mas que tem pouca relevância administrativa em termos de 
variáveis incluídas e assim por diante. Porém, em tais casos, 
que recurso tem o pesquisador? A habilidade para especifi- 
car o modelo de regressão final foi dispensada pelo pesqui- 
sador. O uso dessas técnicas de estimação deve considerar 
uma ponderação entre vantagens encontradas nas mesmas 
versus a falta de controle no estabelecimento do modelo fi- 
nal de regressão. 

3. A terceira advertência se refere principalmente ao proce- 
dimento stepwise. Nessa abordagem, testes de significância 
múltipla são executados no processo de estimação do mode- 
lo. Para garantir que a taxa de erro geral em todos os testes 
de significância seja razoável, o pesquisador deve empregar 
bases mais conservadoras (por exemplo, 0,01) ao acrescen- 
tar ou eliminar variáveis. 


Os métodos de estimação sequencial têm se tornado 
amplamente usados devido a sua eficiência em selecionar 
o subconjunto de variáveis independentes que maximiza 
a precisão preditiva. Com esse benefício vem o potencial 
para resultados enganadores na explicação onde apenas 
uma em um conjunto de variáveis altamente correlacio- 
nadas entra na equação e ocorre uma perda de contro- 
le na especificação do modelo. Esses aspectos potenciais 
não sugerem que métodos de busca sequencial devam ser 
evitados, mas que o pesquisador deve perceber os prós e 
contras envolvidos em seu uso. 


Abordagem combinatória 

O terceiro tipo básico de técnica de estimação é a aborda- 
gem combinatória, que é, principalmente, um processo de 
busca generalizado em todas as possíveis combinações de 
variáveis independentes. O procedimento mais conhecido 
é a regressão em todos os possíveis subconjuntos, a qual 
é exatamente o que o nome sugere. Todas as possíveis 
combinações das variáveis independentes são examinadas 
e o conjunto de variáveis mais adequado é identificado. 
Por exemplo, um modelo com 10 variáveis independentes 
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tem 1024 possíveis regressões (uma equação apenas com 
a constante, 10 equações com uma única variável inde- 
pendente, 45 equações com todas as combinações de duas 
variáveis, e assim por diante). Com procedimentos de 
estimação computadorizados, hoje em dia esse processo 
pode ser gerenciado até mesmo para grandes problemas, 
identificando a melhor equação de regressão geral para 
qualquer número de medidas de ajuste preditivo. 

O uso deste método tem diminuído devido a críticas 
quanto (1) à sua natureza não-teórica e (ii) à falta de con- 
siderações de fatores como multicolinearidade, a identifi- 
cação de observações atípicas e influentes, e a capacidade 
de interpretação dos resultados. Quando esses aspectos 
são considerados, a “melhor” equação pode envolver sé- 
rios problemas que afetam sua adequação, e outro modelo 
pode ser escolhido em última instância. No entanto, esta 
abordagem pode fornecer uma visão sobre o número de 
modelos de regressão que são mais ou menos equivalen- 
tes em poder preditivo, ainda que possuam combinações 
bastante diferentes de variáveis independentes. 


Visão geral das abordagens de seleção de modelos 

Se um método confirmatório, de busca segiiencial ou 
combinatório for escolhido, o critério mais importante 
é o bom conhecimento do pesquisador sobre o contexto 
da pesquisa e alguma fundamentação teórica que permi- 
ta uma perspectiva objetiva e bem informada quanto às 
variáveis a serem incluídas e aos sinais e magnitude espe- 
rados de seus coeficientes (ver Regras Práticas 4-5). Sem 


REGRAS PRÁTICAS 4-5 


Técnicas de estimação 


e Não importa qual técnica de estimação seja escolhida, 
a teoria deve ser um fator orientador na avaliação do 
modelo final de regressão, pois: 

e Especificação confirmatória, o único método que 
permite teste direto de um modelo pré-especificado, 
é também o mais complexo sob as perspectivas 
de erro de especificação, parcimônia de modelo e 
conquista de máxima precisão preditiva. 
Busca sequencial (p.ex., stepwise), embora maximize 
a precisão preditiva, representa uma abordagem 
completamente “automatizada” para estimação de 
modelo, deixando o pesquisador quase sem controle 
sobre a especificação do modelo final. 
Estimação combinatória, embora considere todos 
os modelos possíveis, ainda remove controle do 
pesquisador em termos da especificação do modelo 
final, ainda que o pesquisador possa ver o conjunto 
de modelos mais ou menos equivalentes em termos 
de precisão preditiva. 
Nenhum método específico é o melhor, e a estratégia 
prudente é empregar uma combinação de abordagens 
para capitalizar sobre os pontos fortes de cada um a fim 
de refletir a base teórica da questão de pesquisa. 


esse conhecimento, os resultados da regressão podem ter 
elevada precisão preditiva sem qualquer relevância geren- 
cial ou teórica. Cada método de estimação tem vantagens 
e desvantagens, de modo que nenhum método é sempre 
preferido em detrimento dos outros. Dessa maneira, o 
pesquisador jamais deve confiar totalmente em qualquer 
uma dessas abordagens sem compreender como as im- 
plicações do método de estimação se relacionam com os 
objetivos do pesquisador de previsão e explicação e com 
a fundamentação teórica para a pesquisa. Muitas vezes, o 
uso de dois ou mais métodos combinados pode fornecer 
uma perspectiva mais equilibrada para o pesquisador, no 
lugar de usar apenas uma técnica e tentar abordar todas 
as questões que afetam os resultados. 


Teste se a variável estatística de regressão 
satisfaz as suposições de regressão 


Com as variáveis independentes selecionadas e os coefi- 
cientes de regressão estimados, o pesquisador agora deve 
avaliar se o modelo estimado atende às suposições ineren- 
tes à regressão múltipla. Como discutido no estágio 3, as 
variáveis individuais devem satisfazer as suposições de li- 
nearidade, variância constante, independência e normali- 
dade. Além das variáveis individuais, a variável estatística 
de regressão deve igualmente satisfazer essas suposições. 
Os testes diagnósticos discutidos no estágio 3 podem ser 
aplicados para avaliar o efeito coletivo da variável esta- 
tística pelo exame dos resíduos. Se violações substanciais 
forem encontradas, o pesquisador deverá tomar medidas 
corretivas sobre uma ou mais das variáveis independentes 
e então reestimar o modelo de regressão. 


Exame da significância estatística 
de nosso modelo 


Se tomássemos amostras aleatórias repetidas de respon- 
dentes e estimássemos uma equação de regressão para 
cada amostra, não esperaríamos obter, a cada vez, exata- 
mente os mesmos valores para os coeficientes de regres- 
são. Nem esperaríamos o mesmo nível geral de ajuste de 
modelo. Em vez disso, uma certa variação ao acaso devi- 
do a erros amostrais provocaria diferenças entre muitas 
amostras. Sob a ótica do pesquisador, tomamos apenas 
uma amostra e baseamos nosso modelo preditivo nela. 
Com apenas essa amostra, precisamos testar a hipótese de 
que nosso modelo de regressão pode representar a popu- 
lação e não apenas a amostra. Esses testes estatísticos têm 
duas formas básicas: um teste da variação explicada (coe- 
ficiente de determinação) e um teste para cada coeficiente 
de regressão. 


Significância do modelo geral: teste 

do coeficiente de determinação 

Para testar a hipótese de que a quantia de variação expli- 
cada pelo modelo de regressão é maior que a previsão de 
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A . a DE ge ao 5 . : 
referência (ou seja, que R' é significativamente maior que 
zero), a razão F é calculada como: 


Soma de quadrados, ão, SO di 
Razão F “Graus de liberdade, ão e inusra 
Soma de quadrados |. ii 
Graus de liberdade AFrsdual 


residual 


onde 


Aficsresão = Número de coeficientes estimados (incluindo 
intercepto) — 1 
dfiesáua = Tamanho da amostra — Número de coeficientes 
estimados (incluindo intercepto) 


Três aspectos importantes sobre essa razão devem ser 
observados: 


1. Cada soma de quadrados dividida por seus graus de liberda- 
de (df) apropriados resulta em uma estimativa da variância. 
O numerador da razão F é a variância explicada pelo mo- 
delo de regressão, enquanto o denominador é a variância 
não-explicada. 

2. Intuitivamente, se a razão da variância explicada pela va- 
riância não explicada é alta, a variável estatística de regres- 
são deve ser de valor significante na explicação da variável 
dependente. Usando a distribuição F, podemos fazer um tes- 
te estatístico para determinar se a proporção é diferente de 
zero (i.e., estatisticamente significante). Nos casos em que é 
estatisticamente significante, o pesquisador pode confiar que 
o modelo de regressão não é específico apenas para a amos- 
tra, mas significante em múltiplas amostras da população. 

3. Apesar de valores Rº maiores resultarem em valores F maio- 
res, o pesquisador deve basear qualquer avaliação de signi- 
ficância prática separadamente de significância estatística. 
Como significância estatística é realmente uma avaliação do 
impacto de erro amostral, o pesquisador deve ser cuidadoso 
e não assumir que resultados estatisticamente significantes 
são sempre significantes na prática. Esse cuidado é particular- 
mente relevante no caso de grandes amostras nas quais mes- 
mo pequenos valores R? (p.ex., 5% ou 10%) podem ser esta- 
tisticamente significantes, mas tais níveis de explicação não 
seriam aceitáveis para posterior ação em uma base prática. 


Em nosso exemplo de uso de cartões de crédito, a razão 
Fpara o modelo de regressão simples é (16,5/1) /(5,50/6) 
= 18,0. A estatística F tabelada de 1 com 6 graus de liber- 
dade em um nível de significância de 0,05 produz o valor 
5,99. Como a razão F é maior que o valor tabelado, rejei- 
tamos a hipótese de que a redução no erro que obtivemos 
ao usar o tamanho da família para prever o uso de cartões 
de crédito tenha sido ao acaso. Esse resultado significa 
que, considerando a amostra usada para estimação, po- 
demos explicar a variação 18 vezes mais do que quando 
usamos a média, e que isso não tem muita probabilidade 
de ocorrer ao acaso (menos que 5% das vezes). Do mes- 
mo modo, a razão F para o modelo de regressão múltipla 


com duas variáveis independentes é (18,96/2)/(3,04/5) = 
15,59. O modelo de regressão múltipla também é estatisti- 
camente significante, o que indica que a variável indepen- 
dente adicional foi substancial em acrescentar habilidade 
preditiva ao modelo de regressão. 


Ajuste do coeficiente de determinação 

Como discutido anteriormente na definição de graus de 
liberdade, a adição de uma variável sempre aumenta o 
valor R”. Esse aumento gera então uma preocupação 
com generalidade, pois R? aumentará mesmo que va- 
riáveis preditoras não-significantes sejam adicionadas. 
O impacto é melhor percebido quando o tamanho da 
amostra é próximo ao número de variáveis preditoras 
(chama-se de superajuste — quando o número de graus 
de liberdade é pequeno). Com este impacto minimizado 
quando o tamanho da amostra excede bastante o núme- 
ro de variáveis independentes, diversas orientações têm 
sido propostas, como discutido anteriormente (p.ex., 10 
a 15 observações por variável independente para um mí- 
nimo de 5 observações por variável independente). No 
entanto, o que se faz necessário, é uma medida mais ob- 
jetiva relacionando o nível de superajuste ao Rº obtido 
pelo modelo. 

Essa medida envolve um ajuste com base no número 
de variáveis independentes relativamente ao tamanho da 
amostra. Dessa maneira, acrescentar variáveis não-sig- 
nificantes apenas para aumentar o Rº pode ser descon- 
tado de um modo sistemático. Como parte de todos os 
programas de regressão, um coeficiente ajustado de de- 
terminação (R” ajustado) é dado junto com o coeficiente 
de determinação. Interpretado da mesma forma que o 
coeficiente de determinação não-ajustado, o R” ajusta- 
do se torna menor, uma vez que temos menos observa- 
ções por variável independente. O valor Rº ajustado é 
particularmente útil na comparação entre equações de 
regressão que envolvem diferentes números de variáveis 
independentes ou diferentes tamanhos de amostra, pois 
ele dá um desconto para os graus de liberdade para cada 
modelo. 


= 4a: 2 
Em nosso exemplo de uso de cartões de crédito, R 


para o modelo de regressão simples é 0,751, e o Rº 
ajustado, 0,709. Ao acrescentarmos a segunda variável 
independente, Rº aumenta para 0,861, mas o Rº ajus- 
tado aumenta para apenas 0,806. Quando acrescenta- 
mos a terceira variável, Rº aumenta para apenas 0,872 
e o Rº ajustado diminui para 0,776. Assim, apesar de 
percebermos que Rº sempre aumenta perante o acrés- 
cimo de variáveis, a queda do Rº ajustado diante da 
adição da terceira variável indica um superajuste dos 
dados. Quando discutirmos a avaliação da significân- 
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(Continuação) 
cia estatística de coeficientes de regressão na próxima 
seção, perceberemos que a terceira variável não era 
estatisticamente significante. O Rº ajustado não ape- 
nas reflete superajuste, mas também a adição de variá- 
veis que não contribuem significativamente à precisão 
preditiva. 


Testes de significância de coeficientes de regressão 
O teste da significância estatística para os coeficientes esti- 
mados em análise de regressão é apropriado e necessário 
quando a análise é baseada em uma amostra da população 
e não em um censo. Quando utiliza uma amostra, o pes- 
quisador não está interessado apenas nos coeficientes de 
regressão estimados para aquela amostra, mas está tam- 
bém interessado em como os coeficientes devem variar ao 
longo de repetidas amostras. 


Estabelecimento de um intervalo de confiança. Teste 
de significância de coeficientes de regressão é uma esti- 
mativa estatisticamente fundamentada na probabilidade 
de que os coeficientes estimados em um grande número 
de amostras de um certo tamanho serão de fato diferentes 
de zero. Para julgar isso, um intervalo de confiança deve 
ser estabelecido em torno do coeficiente estimado. Se o 
intervalo de confiança não inclui o valor nulo, então pode- 
se dizer que a diferença entre o coeficiente e zero é esta- 
tisticamente significante. Para tanto, o pesquisador conta 
com três conceitos: 


e Estabelecer o nível de significância (alfa) denota a chance 
que o pesquisador deseja arriscar de estar errado quanto à 
diferença do coeficiente em relação a zero. Um valor típi- 
co é 0,05. À medida que o pesquisador quer uma chance 
menor de estar errado e estabelece um nível menor de sig- 
nificância (p.ex., 0,01 ou 0,001), o teste estatístico se torna 
mais exigente. Aumentar o nível de significância para um 
valor maior (p.ex., 0,10) permite uma maior chance de estar 
errado, mas também faz com seja mais fácil concluir que o 
coeficiente seja diferente de zero. 

e Erro de amostragem é a causa para variação nos coeficien- 
tes de regressão estimados para cada amostra retirada de 
uma população. Para pequenas amostras, o erro amostral 
é maior e os coeficientes estimados variam mais facilmente 
de amostra para amostra. À medida que a amostra aumen- 
ta, torna-se mais representativa da população (ou seja, o 
erro amostral diminui), e a variação nos coeficientes esti- 
mados para grandes amostras se torna menor. Essa rela- 
ção permanece verdadeira até que a análise seja estimada 
usando a população. Neste caso, a necessidade para teste 
de significância é eliminada, pois a amostra é igual à popu- 
lação (i.e., sem erro amostral) e, portanto, perfeitamente 
representativa dela. 


Para ilustrar essa questão, 20 amostras aleatórias para 
quatro tamanhos de amostras (10, 25, 50 e 100 respon- 


dentes) foram tiradas de um grande banco de dados. 
Uma regressão simples foi realizada para cada amostra, 
e os coeficientes de regressão estimados foram regis- 
trados na Tabela 4-8. Como podemos ver, a variação 
nos coeficientes estimados é a maior para amostras de 
10 respondentes, variando de um baixo coeficiente de 
2,20 até um alto de 6,06. Quando o tamanho da amos- 
tra aumenta para 25 e 50 respondentes, o erro amostral 
diminui consideravelmente. Por fim, as amostras de 100 
respondentes têm uma amplitude total de quase metade 
da obtida nas amostras de 10 respondentes (2,10 versus 
3,86). A partir daí, podemos perceber que a habilidade 
do teste estatístico para determinar se o coeficiente é 
realmente maior* que zero se torna mais precisa com as 
amostras maiores. 


e O erro padrão é a variação esperada dos coeficientes esti- 
mados (tanto os coeficientes constantes quanto os de regres- 
são) devido a erro de amostragem. O erro padrão atua como 
o desvio padrão de uma variável representando a dispersão 
esperada dos coeficientes estimados a partir de amostras re- 
petidas deste tamanho. 


Com o nível de significância escolhido e o erro padrão 
calculado, podemos estabelecer um intervalo de confian- 
ça para um coeficiente de regressão com base no erro pa- 
drão, assim como podemos fazer para uma média baseada 
no desvio padrão. Por exemplo, estabelecer o nível de sig- 
nificância em 0,05 resultaria em um intervalo de confiança 
de + 1,96 x erro padrão, denotando os limites externos 
que contêm 95% dos coeficientes estimados de amostras 
repetidas. Com o intervalo de confiança em mãos, o pes- 
quisador agora deve fazer três perguntas sobre a signifi- 
cância estatística de qualquer coeficiente de regressão: 


1. Foiestabelecida a significância estatística? O pesquisador es- 
tabelece o nível de significância do qual se deriva o intervalo 
de confiança (p.ex., um nível de significância de 5% para 
uma grande amostra corresponde ao intervalo de confian- 
ça de + 1,96 x erro padrão). Um coeficiente é considerado 
estatisticamente significante se o intervalo de confiança não 
incluir o zero. 

2. Qualé o papel do tamanho da amostra? Se a amostra é pe- 
quena, o erro amostral pode fazer com que o erro padrão 
seja tão grande que o intervalo de confiança inclua o zero. 
Contudo, se a amostra for maior, o teste tem maior precisão 
porque a variação nos coeficientes se torna menor (i.e., o 
erro padrão é menor). Amostras maiores não garantem que 
os coeficientes não se igualarão a zero, mas farão com que o 
teste seja mais preciso. 

3. Foi fornecida significância prática além da significância esta- 
tística? Como vimos na avaliação da significância estatística 
do valor de R”, só porque um coeficiente é estatisticamente 
significante, não é garantido que também seja praticamente 
significante. Certifique-se de avaliar o sinal e o tamanho de 


*N. de R.T. A frase correta seria “...se o coeficiente é realmente di- 
ferente de zero...”. 
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TABELA 4-8 Variação amostral para coeficientes de regressão estimados 


Tama 


Amostra 10 

| 2,58 

2 2,45 

3 2,20 

4 6,06 

5 2,59 

6 5,06 

Z 4,68 

8 6,00 

9 3,91 

10 3,04 

11 3,74 

12 5,20 

13 5,82 

14 2,23 

15 5,17 

16 3,69 

17 3,17 

18 2,63 

19 3,49 

20 4,57 

Mínimo 2,20 
Máximo 6,06 
Amplitude total 3,86 
Desvio padrão 1,28 


25 


2,52 
2,81 
3,73 
5,64 
4,00 
3,08 
2,66 
4,12 
4,05 
3,04 
3,45 
4,19 
4,68 
3,77 
4,88 
3,09 
3,14 
3,55 
5,02 
3,61 
2,52 
5,64 
3,12 
0,85 


nho da amostra 

50 100 

2,97 3,60 
2,91 3,70 
3,58 3,88 
5,00 4,20 
4,08 3,16 
3,89 3,68 
3,07 2,80 
3,65 4,58 
4,62 3,34 
3,68 3,32 
4,04 3,48 
4,43 3,23 
5,20 3,68 
3,99 4,30 
4,76 4,90 
4,02 3,75 
2,91 3,17 
3,72 3,44 
5,85 4,31 
5,12 4,21 
2,91 2,80 
5,85 4,90 
2,94 2,10 
0,83 0,54 


qualquer coeficiente significante para garantir que ele aten- 
da às necessidades de pesquisa da análise. 


Teste de significância no exemplo de regressão simples. O 
teste da significância de um coeficiente de regressão pode 
ser ilustrado usando nosso exemplo de cartão de crédito 
discutido anteriormente. Discutimos primeiramente quais 
hipóteses são realmente testadas para um modelo de re- 
gressão simples, e então examinamos os níveis de signifi- 
cância para coeficiente e constante. 


Entendimento das hipóteses no teste dos coeficientes 
de regressão. Um modelo de regressão simples implica 
hipóteses sobre dois parâmetros estimados: o coeficiente 
constante e o de regressão. 


A equação de regressão para uso de cartões de crédito 
vista anteriormente é 


Y=b+bV, 
ou 
Y=2,87+ 0,971 (tamanho da família). 


Este modelo de regressão simples requer o teste de 
duas hipóteses para cada coeficiente estimado (o valor 
constante de 2,87 e o coeficiente de regressão 0,971). Es- 
sas hipóteses (comumente chamadas de hipótese nula) 
podem ser formalmente enunciadas como: 


Hipótese 1. O valor do intercepto (termo constan- 
te) de 2,87 é devido a erro amostral, e o verdadeiro 
termo constante apropriado para a população é 
zero. 


Hipótese 2. O coeficiente de regressão de 0,971 (indi- 
cando que um aumento de uma unidade no tamanho 
da família é associado com um aumento no número 
médio de cartões de crédito usados de 0,971) tam- 
bém não difere significantemente de zero. 


Com essas hipóteses, estamos testando se o termo 
constante e o coeficiente de regressão têm um impacto 
diferente de zero. Se descobrimos que eles não dife- 
rem significativamente de zero, consideramos que eles 
não devem ser usados para fins de previsão ou expli- 
cação. 
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Avaliação do nível de significância. O teste apro- 
priado é o teste t, o qual normalmente está disponível 
em programas computacionais de análise de regressão. 
O valor t de um coeficiente é o coeficiente dividido pelo 
erro padrão. Assim, o valor t representa o número de 
erros padrão que o coeficiente se distancia de zero. Por 
exemplo, um coeficiente de regressão de 2,5 com um 
erro padrão de 0,5 teria um valor t de 5,0 (ou seja, o 
coeficiente de regressão está a 5 erros padrão de zero). 
Para determinar se o coeficiente é significantemente di- 
ferente de zero, o valor t computado é comparado ao 
valor de tabela para o tamanho da amostra e o nível de 
confiança selecionado. Se nosso valor for maior que o 
de tabela, poderemos estar confiantes (em nosso sele- 
cionado nível de confiança) de que o coeficiente tem um 
efeito estatisticamente significante na variável estatísti- 
ca de regressão. 

A maioria dos programas de computador calcula o ní- 
vel de significância para o valor t de cada coeficiente de 
regressão, mostrando o nível de significância no qual o 
intervalo de confiança incluiria zero. O pesquisador pode 
então avaliar se esse nível atende o que se deseja para sig- 
nificância. Por exemplo, se a significância estatística do 
coeficiente é 0,02, então diríamos que é significante no ní- 
vel 0,05 (pois é menos que 0,05), mas não significante no 
nível 0,01. 


Usando o teste t para o exemplo de regressão simples, 
podemos avaliar se o coeficiente constante ou de regres- 
são é significativamente diferente de zero. 


e De um ponto de vista prático, o teste de significância 
do termo constante é necessário apenas quando usado 
para valor explanatório. Se for conceitualmente 
impossível para observações existirem com todas as 
variáveis independentes medidas no zero, o termo 
constante estará fora dos dados e atuará somente para 
posicionar o modelo. Neste exemplo, o intercepto não 
tem valor explanatório, pois em nenhum caso acontece 
de todas as variáveis independentes terem valores 
nulos (p.ex., tamanho da família não pode ser zero). 
Assim, significância estatística não é um problema na 
interpretação. 

e Seo coeficiente de regressão ocorrer apenas por causa 
do erro amostral (i.e., zero aparece dentro do intervalo 
de confiança), concluiríamos que o tamanho da família 
não tem impacto generalizável sobre o número de 
cartões de crédito usados além dessa amostra. Observe 
que esse não é um teste para qualquer valor exato do 
coeficiente, mas para saber se ele tem algum valor 
generalizável além da amostra. 

Em nosso exemplo, o erro padrão de tamanho de 
família no modelo de regressão simples é 0,229. O 


valor calculado t é 4,24 (calculado como 0,971/0,229), 
o qual tem uma probabilidade de 0,005. Se estamos 
usando um nível de significância de 0,05, então o 
coeficiente é significativamente diferente de zero. 

Se interpretamos diretamente o valor de 0,005, isso 
significa que podemos estar certos com um grau 
elevado de certeza (99,5%) de que o coeficiente é 
diferente de zero e portanto deve ser incluído na 
equação de regressão. 


O pesquisador deve lembrar que o teste estatístico dos 
coeficientes de regressão e constante é para garantir - em 
todas as possíveis amostras que podemos obter — que os 
parâmetros estimados sejam diferentes de zero dentro de 
um nível de erro aceitável. 


Resumo 

Os testes de significância de coeficientes de regressão 
fornecem ao pesquisador uma avaliação empírica de seu 
“verdadeiro” impacto. Apesar de este não ser um teste 
de validade, ele determina se os impactos representados 
pelos coeficientes são generalizáveis a outras amostras 
dessa população. Uma observação importante referente à 
variação em coeficientes de regressão é que muitas vezes 
os pesquisadores esquecem que os coeficientes estimados 
em sua análise de regressão são específicos da amostra 
usada na estimação. Eles são as melhores estimativas para 
aquela amostra de observações, mas, como os resultados 
anteriores mostram, os coeficientes podem variar muito 
de uma amostra para outra. Essa variação potencial apon- 
ta para a necessidade de esforços canalizados para validar 
qualquer análise de regressão em amostra(s) diferente(s). 
Fazendo isso, o pesquisador deve esperar que os coefi- 
cientes variem, mas a meta é demonstrar que a relação 
geralmente vale em outras amostras, de forma que os 
resultados podem ser considerados generalizáveis para 
qualquer amostra da população. 


Identificação de observações influentes 


Até agora, nos concentramos em identificar padrões ge- 
rais no conjunto inteiro de observações. Aqui, desviamos 
nossa atenção para observações individuais, com o objeti- 
vo de encontrar as observações que 


e estão fora dos padrões gerais do conjunto de dados, ou 
e que influenciam fortemente os resultados de regressão. 


Essas observações não são necessariamente “ruins”, 
no sentido de que devam ser eliminadas. Em muitos casos 
elas representam os elementos distintivos do conjunto de 
dados. No entanto, devemos primeiramente identificá-las 
e avaliar seu impacto antes de seguir adiante. Esta seção 
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introduz o conceito de observações influentes e seu im- 
pacto potencial sobre os resultados de regressão. Uma 
discussão mais detalhada dos procedimentos de identifi- 
cação de observações influentes está disponível em www. 
prenhall.com/hair (em inglês). 


Tipos de observações influentes 

Observações influentes no sentido mais amplo, incluem 
todas as observações que têm um efeito desproporcional 
sobre os resultados da regressão. Os três tipos básicos são 
baseados na natureza de seu impacto sobre os resultados 
da regressão: 


e Observações atípicas são aquelas que têm grandes valo- 
res residuais e podem ser identificadas apenas em relação 
a um modelo específico de regressão. As observações atí- 
picas eram tradicionalmente a única forma de observação 
influente considerada em modelos de regressão, e métodos 
de regressão especializados (p.ex., regressão robusta) foram 
até mesmo desenvolvidos para lidar especificamente com 
o impacto das observações atípicas sobre os resultados de 
regressão [1,12]. O Capítulo 2 fornece procedimentos adi- 
cionais para identificar observações atípicas. 

e Os pontos de alavancagem são observações diferentes das 
demais, com base em seus valores para variáveis indepen- 
dentes. Seu impacto é particularmente perceptível nos co- 
eficientes estimados para uma ou mais variáveis indepen- 
dentes. 

e Observações influentes são a categoria mais ampla, incluin- 
do todas as observações que têm um efeito desproporcional 
sobre os resultados de regressão. As observações influentes 
potencialmente incluem as atípicas e os pontos de alavanca- 
gem, mas podem incluir outras observações também. Além 
disso, nem todas as observações atípicas ou pontos de ala- 
vancagem são necessariamente observações influentes. 


Identificação de observações influentes 
Observações influentes muitas vezes são difíceis de iden- 
tificar através da análise tradicional de resíduos quando 
se procura por observações atípicas. Seus padrões de resí- 
duos passariam não detectados porque o resíduo para os 
pontos influentes (a distância perpendicular entre o pon- 
to e a reta de regressão estimada) não seria tão grande 
a ponto de ser classificado como uma observação atípica. 
Assim, a concentração apenas em grandes resíduos igno- 
raria em geral essas observações influentes. 

A Figura 4-8 ilustra diversas formas de observações in- 
fluentes e seu correspondente padrão de resíduos: 


e Reforço: Na Figura 4-8a, o ponto influente é um “bom” 
ponto, reforçando o padrão geral dos dados e baixando o 
erro padrão da previsão e dos coeficientes. É um ponto de 
alavancagem, mas tem um valor residual pequeno ou nulo, 
uma vez que é bem previsto pelo modelo de regressão. 

e Conflito: Pontos influentes podem ter um efeito contrário 
ao padrão geral dos demais dados, mas ainda ter pequenos 
resíduos (ver Figuras 4-8b e 4-8c). Na Figura 4-8b, duas 
observações influentes explicam quase totalmente a rela- 


ção observada, pois sem elas nenhum padrão real emerge 
dos outros dados. Elas também não seriam identificadas se 
apenas resíduos grandes fossem considerados, pois seu va- 
lor residual seria pequeno. Na Figura 4-8c, é percebido um 
efeito ainda mais profundo, no qual as observações influen- 
tes agem contrariamente ao padrão geral dos demais dados. 
Nesse caso, os dados “reais” teriam resíduos maiores do que 
os pontos influentes ruins. 

Múltiplos pontos influentes também podem funcionar 
na direção do mesmo resultado. Na Figura 4-8e, dois pontos 
influentes têm a mesma posição relativa, tornando a detec- 
ção algo mais difícil. Na Figura 4-8f, observações influentes 
têm posições muito diferentes mas um efeito similar sobre 
os resultados. 

e Desvio: As observações influentes podem afetar todos os re- 
sultados de uma maneira semelhante. Um exemplo é mos- 
trado na Figura 4-8d, onde o coeficiente angular (inclinação) 
permanece constante mas o intercepto é deslocado. Assim, 
a relação entre todas as observações permanece inalterada, 
exceto pelo deslocamento no modelo de regressão. Além 
disso, ainda que todos os resíduos sejam afetados, pouca 
coisa na distinção de características entre eles ajudaria no 
diagnóstico. 


Esses exemplos ilustram que devemos desenvolver 
mais métodos para identificar esses casos influentes. Os 
procedimentos para identificar todos os tipos de observa- 
ções influentes estão se tornando bem difundidos, entre- 
tanto, são ainda menos conhecidos e pouco utilizados em 
análise de regressão. Todos os programas de computador 
fornecem uma análise de resíduos onde aqueles com gran- 
des valores (particularmente resíduos padronizados maio- 
res que 2,0) podem ser facilmente identificados. Ademais, 
a maioria dos programas de computador agora dispõe de 
pelo menos algumas das medidas diagnósticas para iden- 
tificação de pontos de alavancagem e outras observações 
influentes. 


Ações corretivas para observações influentes 

A necessidade de estudo adicional de pontos de alavan- 
cagem e observações influentes é destacada quando per- 
cebemos a extensão substancial em que a generalização 
dos resultados e as conclusões substanciais (a importância 
de variáveis, nível de ajuste e assim por diante) podem 
ser mudadas por apenas um pequeno número de obser- 
vações. Sejam boas (enfatizando os resultados) ou ruins 
(significativamente mudando os resultados), essas obser- 
vações devem ser identificadas para avaliar seu impacto. 
Observações influentes, atípicas e pontos de alavancagem 
são baseados em uma de quatro condições, cada qual com 
um curso específico de ação corretiva: 


1. Um erro em observações ou entrada de dados: Remedie cor- 
rigindo os dados ou eliminando o caso. 

2. Uma observação válida, mas excepcional, explicável por uma 
situação extraordinária: Remedie com eliminação do caso a 
menos que variáveis refletindo a situação extraordinária se- 
jam incluídas na equação de regressão. 
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meme so Coeficiente angular da regressão sem pontos influentes 
Coeficiente angular da regressão com pontos influentes 


FIGURA 4-8 Padrões de observações influentes. 
Fonte: Adaptado de Belsley et al. e Mason e Perreault [2,9]. 


3. Uma observação excepcional sem explicação convincente: 
Apresenta um problema especial, pois faltam razões para 
eliminar o caso; porém sua inclusão também não pode ser 
justificada, o que sugere análises com e sem as observações 
para uma completa avaliação. 

4. Uma observação comum em suas características individuais, 
mas excepcional em sua combinação de características: Indi- 
ca modificações na base conceitual do modelo de regressão, 
e deve ser mantida. 


Em todas as situações, o pesquisador é encorajado a 
eliminar observações verdadeiramente excepcionais, mas 
ainda assim evitar a eliminação daquelas que, apesar de 
diferentes, são representativas da população. Lembre que 
o objetivo é garantir o modelo mais representativo para os 
dados da amostra, de modo que esta melhor reflita a po- 
pulação da qual foi tirada. Essa prática vai além de atingir 
o melhor ajuste preditivo, pois algumas observações atípi- 
cas podem ser casos válidos que o modelo deveria tentar 
prever, ainda que precariamente. O pesquisador também 
deve estar ciente de casos nos quais os resultados seriam 
substancialmente mudados pela eliminação de apenas 
uma observação ou de um número de observações muito 
pequeno. 


O Observação típica 
6 Observação influente 


REGRAS PRÁTICAS 4-6 


Significância estatística e 
observações influentes 


Sempre garanta significância prática quando estiver 
usando amostras grandes, pois os resultados do mo- 
delo e os coeficientes de regressão podem ser consi- 
derados irrelevantes mesmo quando são estatistica- 
mente significantes, devido ao poder estatístico que 
surge de grandes amostras. 

Use o Rº ajustado como sua medida de precisão pre- 
ditiva geral do modelo. 

Significância estatística é exigida para que uma rela- 
ção tenha validade, mas significância estatística sem 
apoio teórico não suporta validade. 

Apesar de observações atípicas serem facilmente 
identificáveis, as outras formas de observações in- 
fluentes que requerem métodos diagnósticos mais 
especializados poder ser igualmente ou mais impac- 
tantes sobre os resultados. 
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ESTÁGIO 5: INTERPRETAÇÃO 
DA VARIAVEL ESTATISTICA 
DE REGRESSAO 


A próxima tarefa do pesquisador é interpretar a variá- 
vel estatística de regressão pela avaliação dos coeficien- 
tes de regressão estimados em termos de sua explicação 
da variável dependente. O pesquisador deve avaliar não 
apenas o modelo de regressão estimado, mas também as 
variáveis independentes potenciais que foram omitidas 
se uma abordagem de busca segiiencial ou combinatória 
foi empregada. Nessas abordagens, a multicolinearidade 
pode afetar substancialmente as variáveis incluídas por 
último na variável estatística de regressão. Assim, além 
de avaliar os coeficientes estimados, o pesquisador deve 
também avaliar o impacto potencial de variáveis omitidas 
para garantir que a significância gerencial seja avaliada 
juntamente com a significância estatística. 


Utilização dos coeficientes de regressão 


Os coeficientes de regressão estimados, chamados de co- 
eficientes b, representam ambos os tipos de relação (po- 
sitiva ou negativa) e a força da relação entre variáveis 
independentes e dependente na variável estatística de 
regressão. O sinal do coeficiente denota se a relação é po- 
sitiva ou negativa, enquanto o valor do coeficiente indica 
a variação no valor dependente cada vez que a variável 
independente muda em uma unidade. 


Por exemplo, no modelo de regressão simples para uso 
de cartões de crédito com tamanho de família como a 
única variável independente, o coeficiente para tamanho 
de família era 0,971. Este coeficiente denota uma relação 
positiva que mostra que quando uma família adiciona 
um membro, espera-se que o uso de cartões de crédito 
aumente em quase uma unidade (0,971). Além disso, se 
o tamanho da família diminui em um membro, o uso de 
cartões de crédito também deve diminuir em quase uma 
unidade (0,971). 


Os coeficientes de regressão têm duas funções-chave 
para atender os objetivos de previsão e explicação para 
qualquer análise de regressão. 


Previsão 

Previsão é um elemento integral na análise de regressão, 
tanto no processo de estimação quanto em situações de 
previsão. Como descrito na primeira seção do capítulo, 
regressão envolve o emprego de uma variável estatística 
(o modelo de regressão) para estimar um único valor para 
a variável dependente. Este processo é usado não apenas 
para calcular os valores previstos no procedimento de es- 
timação, mas também com amostras adicionais utilizadas 
para validação ou para fins de previsão. 


Estimação. Primeiro, no procedimento de estimação de 
mínimos quadrados ordinários (OLS) usado para obter a 
variável estatística de regressão, uma previsão da variável 
dependente é feita para cada observação no conjunto de 
dados. O procedimento de estimação estabelece os pe- 
sos da variável estatística de regressão para minimizar os 
resíduos (p.ex., minimizando as diferenças entre valores 
previstos e reais da variável dependente). Não importa 
quantas variáveis independentes são incluídas no mode- 
lo de regressão, apenas um valor previsto é calculado. 
Como tal, o valor previsto representa o total dos efeitos 
do modelo de regressão e permite que os resíduos, como 
anteriormente discutido, sejam usados extensivamente 
como uma medida diagnóstica para o modelo de regres- 
são geral. 


Previsão. Apesar de previsão ser um elemento integral 
no processo de estimação, os benefícios reais de previsão 
surgem em aplicações. Um modelo de regressão é usado 
nesses casos para previsão com um conjunto de observa- 
ções não usadas na estimação. Por exemplo, considere 
que um gerente desenvolveu uma equação para prever 
vendas mensais de um produto. Após validar o modelo, o 
gerente de vendas insere os valores esperados do próximo 
mês para as variáveis independentes e calcula um valor de 
vendas esperadas. 


Um exemplo simples de uma aplicação de previsão pode 
ser mostrado usando o caso de uso de cartões de crédito. 
Considere que estamos usando a seguinte equação de 
regressão que foi desenvolvida para estimar o número 
de cartões de crédito (Y) usados por uma família: 


Y = 0,286 + 0,635V, + 0,200V, + 0,272V, 


Suponha agora que temos uma família com as se- 
guintes características: tamanho da família (V,) de duas 
pessoas, renda familiar (V,) de 22 ($22.000,00) e número 
de automóveis (V,) sendo três. Qual seria o número es- 
perado de cartões de crédito para tal família? 

Substituímos os valores para V,, V, e V; na equação 
de regressão e calculamos o valor previsto: 


Y =0,286+0,635(2) + 0,200(22) + 0,272(3) 


= 0,286 +1,270+4,40+0,819 
= 6,775 


Nossa equação de regressão prevê que esta família 
teria 6,775 cartões de crédito. 


Explicação 

Muitas vezes o pesquisador está interessado em mais do 
que simples previsão. É importante que um modelo de re- 
gressão tenha previsões precisas para suportar sua valida- 
de, mas muitas questões de pesquisa são mais focadas na 
avaliação da natureza e impacto de cada variável indepen- 
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dente para fazer a previsão da dependente. No exemplo de 
regressão múltipla discutido anteriormente, uma questão 
apropriada é qual variável — tamanho de família ou renda 
— tem o maior efeito na previsão do número de cartões de 
crédito usados por uma família. Variáveis independentes 
com coeficientes de regressão maiores, e todos os demais 
ingredientes iguais, fariam uma contribuição maior para 
o valor previsto. Uma melhor visão sobre a relação entre 
variáveis independentes e dependente é conquistada com 
o exame das contribuições relativas de cada variável inde- 
pendente. Em nosso exemplo simples, um representante 
querendo vender cartões de crédito adicionais e procuran- 
do famílias com mais cartões saberia se deveria procurar 
por famílias com base em seus tamanhos ou rendas. 


Interpretação com coeficientes de regressão. Assim, 
para fins de explicação, os coeficientes de regressão se 
tornam indicadores do impacto relativo e importância das 
variáveis independentes em sua relação com a variável 
dependente. Infelizmente, em muitos casos os coeficien- 
tes de regressão não nos fornecem essa informação dire- 
tamente, sendo que a questão-chave é “todas as outras 
coisas iguais”. Como veremos, a escala das variáveis inde- 
pendentes também entra em cena. Para ilustrar, usamos 


um exemplo simples. 


Suponha que queremos prever o quanto um casal gasta 
em restaurantes durante um mês. Após reunir algumas 
variáveis, descobriu-se que duas variáveis, renda anual 
do marido e da esposa, eram os melhores previsores. A 
equação de regressão que se segue foi calculada usando 
o método de mínimos quadrados: 


Y=30+4INC, + 0,004/NC, 
onde 


INC, = Renda anual do marido (em milhares de dólares) 
INC, = Renda anual da esposa (em reais) 


Se só soubéssemos que INC, e INC, são rendas anuais 
dos dois cônjuges, então provavelmente concluiríamos 
que a renda do marido é muito mais importante (na rea- 
lidade, mil vezes mais) do que a da esposa. Olhando mais 
de perto, porém, podemos ver que as duas rendas são na 
realidade iguais em importância, sendo que a diferença 
está na maneira como são medidas. A renda do marido 
está em milhares de dólares, de modo que uma renda de 
$40.000,00 é usada na equação como 40, enquanto uma 
renda de $40.000,00 da esposa entra como 40.000,00. Se 
prevemos o uso de restaurantes devido apenas à renda 
da esposa, ele seria de $160,00 (40.000,00x0,004), o que 
seria exatamente o mesmo para uma renda do marido 
de 840.000,00 (40x4). Assim, a renda de cada cônjuge é 
igualmente importante, mas esta interpretação prova- 
velmente não aconteceria com um exame apenas dos 
coeficientes de regressão. 


Com o objetivo de usar os coeficientes de regressão 
para fins de explicação, devemos primeiramente garan- 
tir que todas as variáveis independentes estão em escalas 
comparáveis. Mesmo assim, diferenças em variabilidade 
de variável para variável podem afetar o valor do coefi- 
ciente de regressão. O que é necessário é uma maneira 
de tornar todas as variáveis independentes comparáveis 
em escala e variabilidade. Podemos atingir esses objetivos 
e resolver esse problema na explicação usando um coefi- 
ciente de regressão modificado chamado coeficiente beta. 


Padronização dos coeficientes de regressão: coeficien- 
tes beta. A variação em escala e a variabilidade entre 
variáveis tornam a interpretação direta algo problemá- 
tico. O que aconteceria se cada uma de nossas variáveis 
independentes fosse padronizada antes de estimarmos a 
equação de regressão? A padronização converte variá- 
veis a uma escala e uma variabilidade em comum, sendo 
que as mais comuns são uma média de zero (0,0) e um 
desvio padrão de um (1,0). Desse modo, garantimos que 
todas as variáveis são comparáveis. Se ainda queremos 
os coeficientes originais de regressão para fins prediti- 
vos, será que nosso único recurso é a padronização de 
todas as variáveis e então executar uma segunda análise 
de regressão? 

Por sorte, regressão múltipla nos dá não apenas co- 
eficientes de regressão, mas também coeficientes resul- 
tantes da análise de dados padronizados chamados de 
coeficientes beta (f). A vantagem deles é que eliminam o 
problema de se lidar com diferentes unidades de medida 
(como previamente ilustrado) e assim refletem o impac- 
to relativo sobre a variável dependente de uma mudança 
em um desvio padrão em qualquer variável. Agora que 
temos uma unidade comum de medida, podemos deter- 
minar qual variável tem o maior impacto. Retornamos ao 
nosso exemplo com cartões de crédito para ver as dife- 
renças entre os coeficientes de regressão (b) e os coefi- 
cientes beta (P). 


No exemplo dos cartões de crédito, os coeficientes de re- 
gressão (b) e beta (B) para a equação com três variáveis 
independentes (V,, V, e V.) são mostrados aqui: 


Coeficientes 
Variável Regressão (b) Beta (B) 
V, Tamanho da família 0,635 0,566 
V, Renda familiar 0,200 0,416 
V, Número de automóveis 0,272 0,108 


A interpretação usando coeficientes de regressão 
versus beta leva a resultados substancialmente diferen- 
tes. Os coeficientes de regressão indicam que V, é sensi- 
velmente mais importante do que V, ou V,, os quais são 
mais ou menos parecidos. Os coeficientes beta contam 
uma história diferente. V, continua sendo o mais impor- 
tante, mas V, é agora quase tão importante quanto V,, 
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enquanto V, tem importância no máximo periférica. Es- 
ses resultados simples retratam as imprecisões na inter- 
pretação que podem acontecer quando coeficientes de 
regressão são usados com variáveis de diferentes escalas 
e variabilidades. 


A despeito de os coeficientes beta representarem uma 
medida objetiva de importância que pode ser diretamente 
comparada, dois cuidados devem ser observados em seu 
uso: 


e Primeiro, eles devem ser usados como uma diretriz para a 
importância relativa de variáveis independentes individuais 
somente quando a colinearidade é mínima. Como veremos 
na seção a seguir, colinearidade pode distorcer as contribui- 
ções de qualquer variável independente mesmo que coefi- 
cientes beta sejam utilizados. 

e Segundo, os valores beta podem ser interpretados apenas 
no contexto das outras variáveis na equação. Por exemplo, 
um valor beta para tamanho de família reflete sua impor- 
tância só em relação a renda familiar, e não em qualquer 
sentido absoluto. Se outra variável independente fosse 
acrescentada à equação, o coeficiente beta para tamanho 
de família provavelmente mudaria, pois alguma relação 
entre tamanho de família e a nova variável independente 
é provável. 


Em resumo, os coeficientes beta devem ser usados 
apenas como uma orientação para a importância relati- 
va das variáveis independentes incluídas na equação e 
somente para aquelas variáveis com multicolinearidade 
mínima. 


Avaliação da multicolinearidade 


Uma questão-chave na interpretação da variável es- 
tatística de regressão é a correlação entre as variáveis 
independentes. Esse é um problema de dados, e não 
de especificação de modelo. A situação ideal para um 
pesquisador seria ter diversas variáveis independentes 
altamente correlacionadas com a variável dependente, 
mas com pouca correlação entre elas próprias. Se você 
consultar o Capítulo 3 e nossa discussão sobre análise 
fatorial, o uso de escores fatoriais que são ortogonais 
(não-correlacionados) foi sugerido para atingir tal con- 
figuração. 

Todavia, na maioria das situações, particularmente nas 
que envolvem dados de respostas de consumidores, have- 
rá algum grau de multicolinearidade. Em algumas outras 
ocasiões, como o uso de variáveis dicotômicas para repre- 
sentar variáveis não-métricas ou termos polinomiais para 
efeitos não-lineares, o pesquisador está criando situações 
de alta multicolinearidade. A tarefa do pesquisador inclui 
o seguinte: 


e Avaliar o grau de multicolinearidade. 
e Determinar seu impacto sobre os resultados. 
e Aplicar as necessárias ações corretivas, se for o caso. 


Nas seções a seguir, discutimos em detalhes alguns 
procedimentos diagnósticos úteis, os efeitos de multicoli- 
nearidade, e depois ações corretivas possíveis. 


Identificação de multicolinearidade 

A maneira mais simples e óbvia de identificar colineari- 
dade é um exame da matriz de correlação para as variá- 
veis independentes. A presença de elevadas correlações 
(geralmente 0,90 ou maiores) é a primeira indicação de 
colinearidade substancial. No entanto, a falta de valores 
elevados de correlação não garante ausência de colineari- 
dade. Colinearidade pode ser proveniente do efeito com- 
binado de duas ou mais variáveis independentes (o que se 
chama de multicolinearidade). 

Para avaliar multicolinearidade precisamos de uma 
medida que expresse o grau em que cada variável inde- 
pendente é explicada pelo conjunto de outras variáveis 
independentes. Em termos simples, cada variável inde- 
pendente se torna uma variável dependente e é regredida 
relativamente às demais variáveis independentes. As duas 
medidas mais comuns para se avaliar colinearidade aos 
pares ou múltipla são a tolerância e sua inversa, o fator de 
inflação de variância. 


Tolerância. Uma medida direta de multicolinearidade é 
tolerância, a qual é definida como a quantia de variabili- 
dade da variável independente selecionada não explicada 
pelas outras variáveis independentes. Assim, para qualquer 
modelo de regressão com duas ou mais variáveis indepen- 
dentes, a tolerância pode ser simplesmente definida em 
dois passos: 


1. Considere cada variável independente, uma por vez, e cal- 
cule R” — a quantia da variável em questão que é explicada 
por todas as demais variáveis independentes no modelo de 
regressão. Neste processo, a variável independente escolhi- 
da é transformada em uma dependente prevista pelas de- 
mais. 

2. Tolerância é então calculada como 1 — R”. Por exemplo, se 
as outras variáveis independentes explicam 25% da variável 
independente X, (R” = 0,25), então o valor de tolerância de 
X, é 0,75 (1,0- 0,25 = 0,75). 


O valor de tolerância deve ser alto, o que significa um 
pequeno grau de multicolinearidade (i.e., as outras va- 
riáveis independentes coletivamente não têm qualquer 
quantia considerável de variância compartilhada). A de- 
terminação de níveis apropriados de tolerância será abor- 
dada em uma seção adiante. 


Fator de inflação de variância. Uma segunda medida 
de multicolinearidade é o fator de inflação de variância 
(VIF), o qual é calculado simplesmente como o inverso 
do valor de tolerância. No exemplo anterior com uma to- 
lerância de 0,75, o VIF seria 1,33 (1,0/0,75 = 1,33). Assim, 
casos com níveis maiores de multicolinearidade são refle- 
tidos em valores de tolerância menores e valores maiores 
para VIF. O VIF tem seu nome devido ao fato de que a 
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raiz quadrada dele (VVIF) é o grau em que o erro padrão 
aumentou devido à multicolinearidade. Examinemos 
exemplos para ilustrar a inter-relação de tolerância, VIF e 
o impacto sobre erro padrão. 


Por exemplo, se o VIF é igual a 1,0 (o que significa que a 
tolerância é 1,0 e assim não há multicolinearidade), en- 
tão VIE = 1,0e o erro padrão não é afetado. No entan- 
to, consideremos que a tolerância é 0,25 (o que implica 
uma multicolinearidade razoavelmente elevada, uma 
vez que 75% da variância da variável é explicada por 
outras variáveis independentes). Neste caso, o VIF é 4,0 
(1,0/0,25 = 4) e o erro padrão dobrou (4 =2) por conta 
da multicolinearidade. 


O VIF traduz o valor de tolerância, o qual expressa 
diretamente o grau de multicolinearidade em um impac- 
to sobre o processo de estimação. Quando o erro padrão 
aumenta, os intervalos de confiança em torno dos coefi- 
cientes estimados ficam maiores, tornando mais difícil a 
demonstração de que o coeficiente é significativamente 
diferente de zero. 


Os efeitos da multicolinearidade 

Os efeitos da multicolinearidade podem ser classificados 
em termos de explicação ou estimação. No entanto, em 
qualquer caso o motivo inerente é o mesmo: multicoline- 
aridade cria variância “compartilhada” entre variáveis, 
diminuindo assim a capacidade de prever a medida de- 
pendente, bem como averiguar os papéis relativos de cada 
variável independente. A Figura 4-9 retrata as proporções 
de variância compartilhada e única para duas variáveis in- 
dependentes em diferentes casos de colinearidade. Se a 
colinearidade dessas variáveis for nula, então as variáveis 
individuais prevêem 36% e 25% da variância na variável 


dependente, para uma previsão geral (R”) de 61%. À me- 
dida que a multicolinearidade aumenta, a variância total 
explicada diminui (estimação). Além disso, a quantia de 
variância única para as variáveis independentes é redu- 
zida a níveis que tornam a estimação de seus efeitos indi- 
viduais bastante problemática (explicação). As seções a 
seguir tratam desses impactos com mais detalhes. 


Impactos sobre estimação. Multicolinearidade pode ter 
efeitos consideráveis não apenas sobre a habilidade predi- 
tiva do modelo de regressão (como descrito acima), mas 
também sobre a estimação dos coeficientes de regressão e 
seus testes de significância estatística. 


1. Primeiro, o caso extremo de multicolinearidade no qual 
duas ou mais variáveis estão perfeitamente correlacionadas, 
o que se chama de singularidade, impede a estimação de 
qualquer coeficiente. Apesar de singularidades poderem na- 
turalmente ocorrer entre as variáveis independentes, muitas 
vezes elas são um resultado de erro de pesquisa. Um engano 
comum é incluir todas as variáveis dicotômicas usadas para 
representar uma variável não-métrica, em vez de omitir uma 
como a categoria de referência. Além disso, ações como a 
inclusão de uma escala múltipla junto com as variáveis in- 
dividuais que a criaram resultarão em singularidades. Não 
obstante, qualquer que seja o motivo, a singularidade deve 
ser removida antes que se possa proceder com a estimação 
dos coeficientes. 

2. Quando a multicolinearidade aumenta, a capacidade para 
mostrar que os coeficientes de regressão estimados são 
significativamente diferentes de zero pode ficar seriamen- 
te comprometida devido a aumentos no erro padrão como 
mostrado no valor VIF. Essa questão é especialmente pro- 
blemática em amostras menores, onde os erros padrão são 
geralmente maiores por conta de erro de amostragem. 

3. Além de afetar os testes estatísticos dos coeficientes ou o 
modelo geral, elevados graus de multicolinearidade podem 
também resultar em coeficientes de regressão que são incor- 
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FIGURA 4-9 Proporções de variância única e compartilhada por níveis de multicolinearidade. 
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retamente estimados e até mesmo com sinais errados. Dois 
exemplos ilustram esta questão. 


Nosso primeiro exemplo (ver Tabela 4-9) ilustra a situação 
de inversão de sinais devido à elevada correlação negativa 
entre duas variáveis. No Exemplo A, está claro no exame 
da matriz de correlação e das regressões simples que a re- 
lação entre Ye V, é positiva, enquanto a relação entre Y 
e V, é negativa. A equação de regressão múltipla, porém, 
não mantém as relações das regressões simples. Poderia 
parecer para o observador casual que examina apenas os 
coeficientes de regressão múltipla que ambas as relações 
(Ye V, Ye V,) são negativas, quando sabemos não ser o 
caso para Y e V,. O sinal do coeficiente de regressão de V, 
está errado em um sentido intuitivo, mas a forte correlação 
negativa entre V, e V, resulta na inversão de sinal para V. 
Apesar de esses efeitos sobre o procedimento de estima- 
ção ocorrerem principalmente em níveis relativamente al- 
tos de multicolinearidade (acima de 0,80), a possibilidade 
de resultados contra-intuitivos e enganosos demanda uma 
cuidadosa análise de cada variável estatística de regressão 
em busca de uma possível multicolinearidade. 

Uma situação parecida pode ser vista no Exemplo 
B da Tabela 4-9. Aqui, Z, e Z, são positivamente cor- 
relacionadas com a medida dependente (0,293 e 0,631, 
respectivamente), mas têm uma inter-correlação maior 
(0,642). Nesse modelo de regressão, ainda que ambas 
as correlações bivariadas das variáveis independentes 
sejam positivas com a dependente, e as duas variáveis 
independentes estejam positivamente inter-correlacio- 
nadas, quando a equação de regressão é estimada, o 
coeficiente de Z, se torna negativo (-0,343) enquanto o 
outro coeficiente é positivo (0,702). Isso exemplifica o 
caso de elevada multicolinearidade que inverte os sinais 
das variáveis independentes mais fracas (i.e., correlações 
menores com a variável dependente). 


Em alguns casos essa inversão de sinais é esperada e 
desejável. Chamada de efeito de supressão, ela denota ca- 
sos em que a “verdadeira” relação entre a variável depen- 
dente e a(s) independente(s) fica oculta nas correlações 
bivariadas (p.ex., as relações esperadas são não-significan- 
tes ou mesmo invertidas no sinal). Acrescentando variá- 
veis independentes extras e induzindo multicolinearidade, 
alguma variância compartilhada indesejável é explicada, 
e a variância única remanescente permite que os coefi- 
cientes estimados fiquem na direção esperada. Descrições 
mais detalhadas de todos os casos potenciais de efeitos de 
supressão são mostradas em [5]. 

No entanto, em outros casos, as relações teoricamen- 
te embasadas são invertidas por conta da multicolineari- 
dade, deixando ao pesquisador a explicação do por quê 
de os coeficientes terem sinais invertidos em relação ao 
esperado. Nesses casos, o pesquisador pode precisar in- 
verter para usar as correlações bivariadas para descrever 


a relação ao invés dos coeficientes estimados que sofrem 
impacto devido à multicolinearidade. 

Os sinais inversos podem ser encontrados em todos os 
procedimentos de estimação, mas são vistos mais frequen- 
temente em processos de estimação confirmatória, onde 
um conjunto de variáveis entra no modelo de regressão 
e a possibilidade de variáveis mais fracas serem afetadas 
pela multicolinearidade aumenta. 


Impactos sobre explicação. Os efeitos na explicação se 
referem principalmente à habilidade do procedimento de 
regressão e do pesquisador em representar e compreender 
os efeitos de cada variável independente na variável es- 
tatística de regressão. Quando ocorre multicolinearidade 
(mesmo em níveis relativamente baixos de 0,30 ou próxi- 
mos disso), o processo de identificação de efeitos únicos de 
variáveis independentes se torna mais difícil. Lembre-se 
que os coeficientes de regressão representam a quantia de 
variância única explicada por conta de cada variável inde- 
pendente. Como multicolinearidade resulta em porções 
maiores de variância compartilhada e menores níveis de 
variância única, os efeitos das variáveis independentes in- 
dividuais se tornam menos distinguíveis. É até mesmo pos- 
sível encontrar aquelas situações nas quais a multicolinea- 
ridade é tão alta que nenhum dos coeficientes de regressão 
independentes é estatisticamente significante, mesmo que 
o modelo de regressão geral tenha um nível significante de 
precisão preditiva. O Adendo 4-1 fornece mais detalhes 
sobre o cálculo de previsões de variância única e comparti- 
lhada entre variáveis independentes correlacionadas. 


Quanto de multicolinearidade é excessivo? 

Como o valor de tolerância se refere a quanto uma variá- 
vel é não-explicada pelas demais variáveis independentes, 
pequenos valores de tolerância (e assim grandes valores 
VIF, pois VIF = 1/tolerância) denotam elevada colineari- 
dade. Uma referência de corte muito comum é um valor 
de tolerância de 0,10, o que corresponde a um valor VIF 
de 10. No entanto, especialmente quando as amostras são 
menores, o pesquisador pode querer ser mais restritivo 
devido a aumentos nos erros padrão por conta de mul- 
ticolinearidade. Com um VIF de referência de 10, essa 
tolerância corresponderia a erros padrão sendo “inflacio- 
nados” mais do que o triplo (10 = 3,16) do que seriam se 
não houvesse multicolinearidade. 

Cada pesquisador deve determinar o grau de colinea- 
ridade que é aceitável, pois a maioria das referências re- 
comendadas ainda permite substancial colinearidade. Por 
exemplo, o corte sugerido para o valor de tolerância de 
0,10 corresponde a uma correlação múltipla de 0,95. Além 
disso, uma correlação múltipla de 0,9 entre uma variável 
independente e todas as demais (semelhante à regra que 
aplicamos na matriz de correlação aos pares) resultaria 
em um valor de tolerância de 0,19. Logo, qualquer variá- 
vel com tolerância abaixo de 0,19 (ou acima de um VIF de 
5,3) teria uma correlação superior a 0,90. 
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TABELA 4-9 Estimativas de regressão com dados multicolineares 


EXEMPLO A EXEMPLO B 
Dados Dados 
Identificação Y V, V, Identificação Y Z, Z 
1 5 6 13 1 3,7 3,2 2,9 
2 3 8 13 2 3,7 3,3 4,2 
3 9 8 11 3 4,2 3,7 4,9 
4 9 10 11 4 4,3 3,3 5,1 
5 13 10 9 5 5,1 4,1 5,5 
6 11 12 9 6 5,2 3,8 6,0 
7 17 12 7 7 5,2 2,8 4,9 
8 15 14 7 8 5,6 2,6 4,3 
9 5,6 3,6 5,4 
10 6,0 4,1 5,5 
Matriz de correlação Matriz de correlação 
Y V, V, Y Z, Z 
Y 1,0 Y 1,0 
V, 0,823 1,0 £ 0,293 1,0 
V, —0,977 —0,913 1,0 Z 0,631 0,642 1,0 


Estimativas de regressão 


Estimativas de regressão 


Regressão simples (V,): 
Y=-4,75+ 1,5V, 

Regressão simples (V,): 
Y=29,75- 1,95V, 

Regressão múltipla (V,, V5): 
Y=44,75-0,75V,-2,7V, 


Regressão simples (Z,): 
Y=2,996 + 0,525Z, 
Regressão simples (Z,): 
Y= 1,999 + 0,587Z, 
Regressão múltipla (Z,, Z,): 
Y=2,659- 0,343Z, + 0,702Z, 


Adendo 4-1 Cálculo da Variância Única e Compartilhada 


entre Variáveis Independentes 


A base para estimar todas as relações de regressão é a 
correlação, que mede a associação entre duas variáveis. 
Na análise de regressão, as correlações entre as variáveis 
independentes e a variável dependente fornecem a base 
para formar a variável estatística de regressão por meio da 
estimação dos coeficientes de regressão (pesos) para cada 
variável independente que maximiza a previsão (variân- 
cia explicada) da variável dependente. Quando a variável 
estatística contém apenas uma variável independente, o 
cálculo dos coeficientes de regressão é direto e baseado na 
correlação bivariada (ou de ordem zero) entre a variável 
independente e a dependente. O percentual de variância 
explicada da variável dependente é simplesmente o qua- 
drado da correlação bivariada. 

Mas conforme variáveis independentes são acrescenta- 
das à variável estatística, os cálculos também devem con- 
siderar as inter-correlações entre variáveis independentes. 
Se as variáveis independentes são correlacionadas, então 
elas “compartilham” algo de seu poder preditivo. Como 
usamos apenas a previsão da variável estatística geral, a 
variância compartilhada não deve ser “contada duas ve- 
zes” usando apenas as correlações bivariadas. Logo, cal- 


culamos duas formas adicionais da correlação para repre- 
sentar esses efeitos compartilhados: 


1. O coeficiente de correlação parcial é a correlação de uma 
variável independente (X,) e dependente (Y) quando os 
efeitos da(s) outra(s) variável(eis) independente(s) foram 
removidos de X, e Y. 

2. A correlação semiparcial reflete a correlação entre uma va- 
riável independente e a dependente enquanto controla os 
efeitos preditivos de todas as demais variáveis independen- 
tes sobre X.. 


As duas formas de correlação diferem no sentido de 
que a correlação parcial remove os efeitos de outras va- 
riáveis independentes de X, e Y, enquanto a correlação 
semiparcial remove os efeitos apenas de X, A correlação 
parcial representa o efeito preditivo incremental de uma 
variável independente a partir do efeito coletivo de todas 
as demais e é usada para identificar variáveis independen- 
tes que têm o maior poder preditivo incremental quando 
um conjunto de variáveis independentes já está na va- 
riável estatística de regressão. A correlação semiparcial 
representa a única relação prevista por uma variável in- 
dependente depois que as previsões compartilhadas com 
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todas as outras variáveis independentes são desconsidera- 
das. Assim, a correlação semiparcial é usada na distribui- 
ção de variância entre as variáveis independentes. Elevar 
ao quadrado a correlação semiparcial fornece a variância 
única explicada pela variável independente. 

O diagrama a seguir retrata a variância compartilhada e 
única entre duas variáveis independentes correlacionadas. 


há 


a = variância de Y explicada unicamente por X, 

b= variância de Y explicada unicamente por X, 

c= variância de Y explicada juntamente por X, e X, 
d = variância de Y não explicada por X, ou X, 


A variância associada com a correlação parcial de X, 
controlando X, pode ser representada como b/ (d + b), 
onde d + b representa a variância não-explicada depois da 
contribuição explicativa de X,. A correlação semiparcial de 
X, controlando X, é b/(a+b+c+d),ondea+b+c+d 
representa a variância total de Y, e b é a quantia explicada 
unicamente por X,. 

O analista pode também determinar a variância com- 
partilhada e única para variáveis independentes através de 
cálculo simples. A correlação semiparcial entre a variável 
dependente (Y) e uma independente (X,) enquanto se con- 
trola uma segunda variável independente (X,) é calculada 
pela seguinte equação: 


Correlação semiparcial de Y, X,, dado X, = 
Corr de Y, X, - (Corr de Y, X,x Corr de Y,, X,) 


V1,0-(Corr de X,, X,)* 


Um exemplo simples de duas variáveis independentes 
(X, e X,) ilustra o cálculo da variância tanto compartilhada 
quanto única da variável dependente (Y). As correlações 
diretas e a correlação entre X, e X, são exibidas na matriz 
de correlações a seguir: 


PP HE 
Y 10 
x, 060 10 


X, 050 0,70 1,0 


As correlações diretas de 0,60 e 0,50 representam rela- 
ções razoavelmente fortes com Y, mas a correlação de 0,70 


* N. de R. T.: O denominador correto seria (/1,0- (Corr de X,, X))º 


entre X, e X, significa que uma porção substancial desse 
poder preditivo pode ser compartilhada. A correlação se- 
miparcial de X, e Y controlando X, (r, y (x,)) € a variância 
única prevista por X, pode ser calculada como: 


0,60-(0,50x 0,70) 
V1,0-0,70? 


0,35 


r 
YX(X) 


Variância única prevista por X, = 0,35” = 0,1225 


Como a correlação direta de X, e Y é 0,60, também 
sabemos que a variância total prevista por X, é 0,60”, ou 
0,36. Se a variância única é 0,1225, então a variância com- 
partilhada deve ser 0,2375 (0,36 — 0,1225). 

Podemos calcular a variância única explicada por X, e 
confirmar a variância compartilhada da seguinte manei- 
ra: 


0,50-(0,60x 0,70) 
V1,0-0,70? 


0,11 


r, 
YA (Xp 


Variância única prevista por X, = 0,11? = 0,0125. 


Com a variância total explicada por X, sendo 0,50”, ou 
0,25, a variância compartilhada é calculada como 0,2375 
(0,25 — 0,0125). Este resultado confirma o que se encon- 
trou nos cálculos para X,. 

Logo, a variância total (R”) explicada pelas duas variá- 
veis independentes é 


Variância única explicada por X, 0,1225 
Variância única explicada por X, 0,0125 
Variância compartilhada explicada por Xe X, 0,2375 
Variância total explicada por X, e X, 0,3725 


Esses cálculos podem ser estendidos para mais de duas 
variáveis, mas à medida que o número de variáveis au- 
menta, fica mais fácil permitir que programas estatísticos 
façam os cálculos. 

O cálculo de variância compartilhada e única ilustra 
os efeitos de multicolinearidade sobre a habilidade das 
variáveis independentes para preverem a dependente. A 
Figura 4-9 mostra esses efeitos diante de níveis altos e bai- 
xos de multicolinearidade. E 


Insistimos que o pesquisador sempre deve especificar 
os valores de tolerância em programas de regressão, pois 
os valores padrão para exclusão de variáveis colineares 
permitem um grau elevado de colinearidade. Por exem- 
plo, o valor padrão de tolerância no SPSS para exclusão 
de uma variável é 0,0001, o que significa que, até com mais 
do que 99,99% da variância prevista pelas outras variáveis 
independentes, a variável poderia ser incluída na equação 
de regressão. Estimativas dos efeitos reais da colinearida- 
de alta sobre os coeficientes estimados são possíveis, mas 
estão além do escopo deste texto (ver Neter et al. [11]). 
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Mesmo com diagnósticos que usam valores de VIF ou 
de tolerância, ainda não sabemos necessariamente quais 
variáveis estão intercorrelacionadas. Um procedimento 
devido a Belsley et al. [2] permite que as variáveis correla- 
cionadas sejam identificadas, mesmo que tenhamos corre- 
lação entre diversas variáveis. Ele fornece ao pesquisador 
maior poder diagnóstico na avaliação da extensão e do 
impacto de multicolinearidade e é discutido no suplemen- 
to deste capítulo, encontrado na Web em www.bookman. 
com.br. 


Ações corretivas para multicolinearidade 

As ações corretivas para a multicolinearidade variam des- 
de a modificação da variável estatística de regressão até o 
uso de procedimentos especializados de estimação. Assim 
que o grau de colinearidade tenha sido determinado, o 
pesquisador tem várias opções: 


1. Omitir uma ou mais variáveis independentes altamente cor- 
relacionadas e identificar outras variáveis independentes 
para ajudar na previsão. No entanto, o pesquisador deve ser 
cuidadoso ao seguir esta opção, para evitar a criação de um 
erro de especificação quando eliminar uma ou mais variá- 
veis independentes. 

2. Usar o modelo com as variáveis independentes altamente 
correlacionadas apenas para previsão (ou seja, jamais tentar 
interpretar os coeficientes de regressão), apesar de se reco- 
nhecer o menor nível de habilidade preditiva geral. 

3. Usar as correlações simples entre cada variável independen- 
te e a dependente para compreender a relação entre variá- 
veis independentes e dependente. 


REGRAS PRÁTICAS 4-7 


Interpretação da variável estatística de regressão 


e Interprete o impacto de cada variável independente 
relativamente às demais variáveis no modelo, pois 
reespecificação de modelo pode ter profundo efeito sobre 
as outras variáveis: 

e Use pesos beta quando comparar importância relativa 
entre variáveis independentes 
Coeficientes de regressão descrevem mudanças na 
variável dependente, mas podem ser difíceis para 
comparar ao longo de variáveis independentes se os 
formatos das respostas variarem 

Multicolinearidade pode ser considerada "boa" quando 

revela um efeito supressor, mas geralmente é vista 

como inconveniente pelo fato de que aumentos na 

multicolinearidade: 

e Reduzem o Rº geral que pode ser conseguido 

e Confundem a estimação dos coeficientes de regressão 

e Afetam negativamente os testes de significância 
estatística de coeficientes 

Níveis geralmente aceitos de multicolinearidade (valores 

de tolerância de até 0,10, correspondendo a um VIF de 

10) devem ser diminuídos em amostras menores devido a 

aumentos no erro padrão atribuíveis à multicolinearidade. 


4. Usar um método mais sofisticado de análise, como a regres- 
são Bayesiana (ou um caso especial — regressão ridge) ou a 
regressão sobre componentes principais para obter um mo- 
delo que reflita mais claramente os efeitos simples das va- 
riáveis independentes. Esses procedimentos são discutidos 
com mais detalhes em vários textos [2, 11]. 


Cada opção requer que o pesquisador faça um julga- 
mento das variáveis incluídas na variável estatística de re- 
gressão, o qual deve sempre ser guiado pela base teórica 
do estudo. 


ESTÁGIO 6: VALIDAÇÃO 
DOS RESULTADOS 


Após identificar o melhor modelo de regressão, o passo 
final é garantir que ele represente a população geral (ge- 
neralização) e seja apropriado às situações nas quais será 
usado (transferibilidade). O melhor critério é a extensão 
em que o modelo de regressão se ajusta a um modelo teó- 
rico existente ou um conjunto de resultados previamente 
validados sobre o mesmo tópico. Em muitos casos, con- 
tudo, não há resultados anteriores ou teoria disponíveis. 
Assim, também discutimos abordagens empíricas para a 
validação de modelo. 


Amostras adicionais ou particionadas 


A abordagem empírica de validação mais apropriada é 
testar o modelo de regressão em uma nova amostra tira- 
da da população geral. Uma nova amostra garantirá re- 
presentatividade e pode ser usada de diversas maneiras. 
Primeiro, o modelo original pode prever valores na nova 
amostra e o ajuste preditivo pode ser calculado. Segundo, 
um modelo separado pode ser estimado com a nova amos- 
tra e então comparado com a equação original em relação 
a características como as variáveis significantes incluídas; 
sinal, tamanho e importância relativa de variáveis; e pre- 
cisão preditiva. Em ambos os casos, o pesquisador deter- 
mina a validade do modelo original, comparando-o com 
modelos de regressão estimados com a nova amostra. 

Muitas vezes, a habilidade de coletar novos dados é li- 
mitada ou impraticável por fatores como custo, pressões de 
tempo ou disponibilidade de respondentes. Quando esse é 
o caso, o pesquisador pode dividir a amostra em duas par- 
tes: uma subamostra de estimação para criar o modelo de 
regressão, e uma subamostra de reserva ou validação, usa- 
da para “testar” a equação. Muitos procedimentos, tanto 
aleatórios quanto sistemáticos, estão disponíveis para divi- 
dir os dados, de modo que cada um tire duas amostras in- 
dependentes do conjunto único de dados. Todos os pacotes 
estatísticos populares têm opções específicas para permitir 
estimação e validação em subamostras separadas. O Capí- 
tulo 5 apresenta uma discussão sobre o uso de subamostras 
de estimação e validação em análise discriminante. 
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Seja uma nova amostra definida ou não, é provável 
que ocorram diferenças entre o modelo original e outros 
esforços de validação. O papel do pesquisador agora passa 
a ser o de um mediador entre os vários resultados, procu- 
rando o melhor modelo ao longo de todas as amostras. A 
necessidade de empreendimentos contínuos de validação 
e refinamentos do modelo nos lembra que nenhum mo- 
delo de regressão, a não ser que seja estimado a partir da 
população inteira, é o modelo final e absoluto. 


Cálculo da estatística PRESS 


Uma abordagem alternativa para obter amostras adicio- 
nais para fins de validação é empregar a amostra original 
de uma maneira especializada, calculando a estatística 
PRESS, uma medida semelhante a R”, usada para avaliar 
a precisão preditiva do modelo de regressão estimado. Di- 
fere das abordagens anteriores no sentido de que não um, 
mas n — 1 modelos de regressão são estimados. O proce- 
dimento omite uma observação na estimação do modelo 
de regressão e então prevê a observação omitida com o 
modelo estimado. Logo, a observação não pode afetar 
os coeficientes do modelo usado para calcular seu valor 
previsto. O procedimento é aplicado novamente, omitin- 
do uma outra observação, estimando um novo modelo e 
fazendo a previsão. Os resíduos para as observações po- 
dem então ser somados para fornecer uma medida geral 
de ajuste preditivo. 


Comparação de modelos de regressão 


Quando se comparam modelos de regressão, o critério 
mais comum empregado é o ajuste preditivo geral. Rnos 
fornece essa informação, mas apresenta uma desvantagem: 
à medida que mais variáveis são acrescentadas, Rsempre 
aumenta. Assim, incluindo todas as variáveis independen- 
tes, jamais encontraremos outro modelo com Rº maior, 
mas podemos descobrir que um número menor de variá- 
veis independentes resulta em um valor quase idêntico. 
Portanto, para comparar modelos com diferentes núme- 
ros de variáveis independentes, usamos o Rº ajustado. O 
Rº ajustado é igualmente útil na comparação de modelos 
com diferentes conjuntos de dados, uma vez que faz uma 
compensação para os diferentes tamanhos de amostras. 


Previsão com o modelo 


As previsões sempre podem ser feitas aplicando o mode- 
lo estimado a um novo conjunto dos valores de variáveis 
independentes e calculando os valores da variável depen- 
dente. No entanto, fazendo isso, devemos considerar di- 
versos fatores que podem ter um sério impacto na quali- 
dade das novas previsões: 


1. Quando aplicamos o modelo a uma nova amostra, devemos 
lembrar que as previsões agora têm não apenas as varia- 


ções em relação à amostra original, mas também aquelas da 
amostra recém-obtida. Assim, sempre devemos calcular os 
intervalos de confiança de nossas previsões junto com a es- 
timativa pontual para ver a amplitude esperada dos valores 
da variável dependente. 

2. Devemos estar certos de que as condições e relações me- 
didas no momento em que a amostra original foi obtida 
não mudaram substancialmente. Por exemplo, em nosso 
exemplo de cartões de crédito, se a maioria das empresas 
começasse a cobrar maiores taxas por seus cartões, o uso de 
cartões de crédito poderia mudar substancialmente, ainda 
que essa informação não fosse incluída no modelo. 

3. Finalmente, não devemos usar o modelo para estimar além 
da amplitude das variáveis independentes encontradas na 
amostra. Por exemplo, em nosso caso de cartões de crédi- 
to, se a maior família tem seis membros, pode ser impru- 
dente prever uso de cartões de crédito para famílias com 
10 membros. Não se pode assumir que as relações são as 
mesmas para valores das variáveis independentes substan- 
cialmente maiores ou menores que os da amostra original 
de estimação. 


ILUSTRAÇÃO DE UMA | 
ANALISE DE REGRESSAO 


As questões referentes à aplicação e interpretação da 
análise de regressão foram discutidas nas seções pre- 
cedentes seguindo-se a estrutura de seis estágios para 
construção de modelo introduzida no Capítulo 1 e dis- 
cutida no presente capítulo. Para fornecer uma ilustra- 
ção das questões importantes em cada estágio, apresen- 
tamos um exemplo que detalha a aplicação da regressão 
múltipla a um problema de pesquisa especificado pela 
HBAT. O Capítulo 1 introduziu uma pesquisa na qual 
a HBAT obteve várias medidas em uma enquete entre 
clientes. Para demonstrar o uso da regressão múltipla, 
mostramos os procedimentos usados por pesquisadores 
para tentar prever satisfação de clientela dos indivíduos 
na amostra com um conjunto de 13 variáveis indepen- 
dentes. 


Estágio 1: Objetivos da regressão múltipla 


A administração da HBAT há muito tem se interessado 
por previsões mais precisas do nível de satisfação de seus 
clientes. Se bem sucedida, isso forneceria uma melhor 
fundamentação para seus esforços de marketing. Para 
este propósito, pesquisadores da HBAT propuseram que 
análise de regressão múltipla deveria ser tentada para 
prever a satisfação de clientes com base em suas percep- 
ções do desempenho de HBAT. Além de encontrar um 
meio de prever com precisão a satisfação, os pesquisa- 
dores também estavam interessados na identificação dos 
fatores que conduzem à satisfação aumentada para uso 
em campanhas diferenciadas de marketing. 
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Para aplicar o procedimento de regressão, os pesquisa- 
dores selecionaram satisfação do cliente (X,9) como a 
variável dependente (Y) a ser prevista por variáveis in- 
dependentes que representavam percepções da atuação 
da HBAT. As 13 variáveis a seguir foram incluídas como 
independentes: 


Qualidade do produto 
Comércio eletrônico 
Suporte técnico 
Solução de reclamação 
Anúncio 


Linha do produto 

Imagem da equipe de venda 
Preço competitivo 
Garantia e reclamações 
Novos produtos 
Encomenda e cobrança 
Flexibilidade de preço 
Velocidade de entrega 


[EN 


mm de de e 


[= 


A relação entre as 13 variáveis independentes e a satis- 
fação do cliente foi considerada estatística, não funcional, 
porque envolvia percepções de atuação e poderia ter ní- 
veis de erro de medida. 


Estágio 2: Planejamento de pesquisa de 
uma análise de regressão múltipla 


A pesquisa da HBAT obteve 100 respondentes de sua base 
de clientes. Todos deram respostas completas, que resulta- 
ram em 100 observações disponíveis para análise. A pri- 
meira questão a ser respondida referente ao tamanho da 
amostra é o nível de relação (R?) que pode ser detectado 
em conformidade com a análise de regressão proposta. 


A Tabela 4-7 indica que a amostra de 100, com 13 variá- 
veis potencialmente independentes, é capaz de detectar 
relações com valores Rº de aproximadamente 23% a um 
poder de 0,80 com o nível de significância fixado em 0,01. 
Se o nível de significância for relaxado para 0,05, então 
a análise identificará relações que explicam em torno de 
18% da variância. A amostra de 100 observações tam- 
bém atende à diretriz de proporção mínima de observa- 
ções por variáveis independentes (5:1) com uma propor- 
ção real de 7:1 (100 observações com 13 variáveis). 


A análise de regressão proposta foi considerada sufi- 
ciente para identificar não apenas relações estatisticamente 
significantes, mas também relações que tinham significân- 
cia gerencial. Apesar de pesquisadores HBAT poderem 


estar razoavelmente certos de que eles não estão em pe- 
rigo de superajustar a amostra, eles ainda devem validar 
os resultados, se possível, para garantir a generalidade das 
descobertas para a base inteira de clientes, particularmen- 
te quando usarem uma técnica de estimação stepwise. 


Estágio 3: Suposições em análise 
de regressão múltipla 


Atender às suposições da análise de regressão é essencial 
para garantir que os resultados obtidos são verdadeiramen- 
te representativos da amostra e que obtemos os melhores 
resultados possíveis. Quaisquer violações sérias das suposi- 
ções devem ser detectadas e corrigidas, se possível. A análi- 
se para garantir que a pesquisa está atendendo às suposições 
básicas da análise de regressão envolve dois passos: (1) tes- 
tar as variáveis individuais dependente e independentes e 
(2) testar a relação geral após a estimação do modelo. Esta 
seção aborda a avaliação de variáveis individuais. A relação 
geral será examinada depois que o modelo for estimado. 

As três suposições a serem abordadas para as variáveis 
individuais são linearidade, variância constante (homoce- 
dasticidade) e normalidade. Para os propósitos da análi- 
se de regressão, resumimos os resultados encontrados no 
Capítulo 2 detalhando o exame das variáveis dependente 
e independentes. 


Primeiro, os diagramas de dispersão das variáveis in- 
dividuais não indicaram relações não-lineares entre a 
variável dependente e as independentes. Os testes para 
heteroscedasticidade descobriram que apenas duas va- 
riáveis (X,e X,,) violaram ligeiramente essa suposição, 
não necessitando qualquer ação corretiva. Finalmente, 
nos testes de normalidade, seis variáveis (X,, X,, X 3, Xá, 
X,.e X,,) demonstraram ter violado os testes estatísti- 
cos. Para todas as variáveis, exceto uma (X,,), transfor- 
mações eram ações corretivas suficientes. 


Apesar de a análise de regressão ter se mostrado bas- 
tante robusta mesmo quando a suposição de normalidade 
é violada, os pesquisadores devem estimar a análise de re- 
gressão com as variáveis originais e também com as trans- 
formadas para avaliar as consegiiências da não-normalida- 
de das variáveis independentes sobre a interpretação dos 
resultados. Para este fim, as variáveis originais são usadas 
primeiramente, e resultados posteriores para as variáveis 
transformadas são mostrados para comparação. 


Estágio 4: Estimação do modelo de regressão 
e avaliação do ajuste geral do modelo 


Com a análise de regressão especificada em termos de va- 
riáveis dependente e independentes, a amostra considera- 
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da adequada para os objetivos do estudo e as suposições 
avaliadas para as variáveis individuais, o processo de cons- 
trução do modelo agora segue para a estimação do modelo 
de regressão e a avaliação do ajuste geral do modelo. Para 
fins de ilustração, o procedimento stepwise é empregado 
para selecionar variáveis para inclusão na variável estatís- 
tica de regressão. Depois que o modelo de regressão for 
estimado, a variável estatística será avaliada em relação às 
suposições da análise de regressão. Finalmente, as obser- 
vações serão examinadas para determinar se alguma ob- 
servação deve ser considerada influente. Todas essas ques- 
tões são discutidas nas seções que se seguem. 


Estimação stepwise: seleção 

da primeira variável 

O procedimento de estimação stepwise maximiza a variân- 
cia explicada incremental em cada passo da construção do 
modelo. No primeiro passo, a mais elevada correlação bi- 
variada (também a mais elevada correlação parcial, uma 
vez que nenhuma outra variável está na equação) será sele- 
cionada. O processo para o exemplo HBAT segue abaixo. 


A Tabela 4-10 mostra todas as correlações entre as 13 
variáveis independentes e suas correlações com a de- 
pendente (X,,, Satisfação do cliente). O exame da ma- 
triz de correlação (olhando-se a primeira coluna) indica 
que a solução de reclamação (X,) tem a mais elevada 
correlação bivariada com a variável dependente (0,603). 
O primeiro passo é construir uma equação de regressão 
usando apenas essa variável independente. Os resulta- 
dos deste primeiro passo são exibidos na Tabela 4-11. 


Ajuste geral do modelo. A partir da Tabela 4-11 o pes- 
quisador pode abordar questões concernentes ao ajuste 
geral do modelo, bem como à estimação stepwise do mo- 
delo de regressão. 


Rmúltiplo. Rmúltiplo é o coeficiente de correlação 
(neste passo) para a regressão simples de X, e a variável 
dependente. Não tem sinal negativo ou positivo porque, 
em regressão múltipla, os sinais das variáveis individuais 
podem variar, e assim este coeficiente reflete apenas o 
grau de associação. No primeiro passo da estimação ste- 
pwise, o R múltiplo coincide com a correlação bivariada 
(0,603), pois a equação contém somente uma variável. 


R quadrado. R quadrado (R”) é o coeficiente de cor- 
relação ao quadrado (0,603” = 0,364), também conhecido 
como o coeficiente de determinação. Esse valor indica o 
percentual de variação total de Y (X,9, Satisfação do clien- 
te) explicado pelo modelo de regressão consistindo de X,. 


Erro padrão da estimativa. O erro padrão da 
estimativa é uma outra medida da precisão de nossas 


previsões. É a raiz quadrada da soma dos quadrados 
dos erros dividida pelo número de graus de liberdade, 
também representada pela raiz quadrada do MS qua 
(/89,45-98 = 0,955). Representa uma estimativa do 
desvio-padrão dos valores reais dependentes em torno da 
reta de regressão; ou seja, é uma medida de variação em 
torno da reta de regressão. O erro padrão da estimativa 
também pode ser visto como o desvio-padrão dos erros 
de previsão, de modo que se torna uma medida para ava- 
liar o tamanho absoluto do erro de previsão. Também é 
usado para estimar o tamanho do intervalo de confiança 
para as previsões. Ver Neter et al. [11] para detalhes refe- 
rentes a esse procedimento. 


ANOVA e Razão F. A análise ANOVA fornece o 
teste estatístico para o ajuste geral do modelo em termos 
da razão F. A soma total de quadrados (51,178 + 89,450 
= 140,628) é o erro quadrado que ocorreria se usássemos 
apenas a média de Y para prever a variável dependen- 
te. O uso dos valores de X, reduz esse erro em 36,4% 
(51,178/140,628). Tal redução é considerada estatistica- 
mente significante com uma razão F de 56,070 e um nível 
de significância de 0,000. 


Variáveis na equação (passo 1). No passo 1, uma úni- 
ca variável independente (X,) é utilizada para calcular a 
equação de regressão para prever a variável dependente. 
Para cada variável na equação, diversas medidas precisam 
ser definidas: o coeficiente de regressão, o erro padrão do 
coeficiente, o valor t de variáveis na equação, e os diagnó- 
ticos de colinearidade (tolerância e VIF). 


Coeficientes de regressão (Be Beta). O coeficiente 
de regressão (b) e o coeficiente padronizado (fp) refle- 
tem a mudança na medida dependente para cada unida- 
de de mudança na variável independente. Comparação 
entre coeficientes de regressão viabiliza uma avaliação 
relativa da importância de cada variável no modelo de 
regressão. 


O valor 0,595 é o coeficiente de regressão (by) para a variá- 
vel independente (X9). O valor previsto para cada obser- 
vação é o intercepto (3,680) mais o coeficiente de regres- 
são (0,595) vezes seu valor da variável independente (Y = 
3,680 + 0,595X,). O coeficiente de regressão padronizado, 
ou valor beta, de 0,603 é o valor calculado a partir dos da- 
dos padronizados. Com apenas uma variável independen- 
te, o coeficiente beta ao quadrado se iguala ao coeficiente 
de determinação. O valor beta permite comparar o efeito 
de X, sobre Y com o efeito sobre Y de outras variáveis 
independentes em cada estágio, pois esse valor reduz o 
coeficiente de regressão a uma unidade comparável, o nú- 
mero de desvios-padrão. (Note que neste momento não 
dispomos de outras variáveis para comparação.) 
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TABELA 4-11 


Exemplo de resultado: passo 1 do exemplo de regressão múltipla da HBAT 


Passo 1 — Variável introduzida: X, Solução de reclamação 


R múltiplo 0,603 
Coeficiente de determinação (R?) 0,364 
Rº ajustado 0,357 
Erro padrão da estimativa 0,955 
Análise de variância 
Soma de 
quadrados df Quadrado médio F Sig. 
Regressão 51,178 1 51,178 56,070 0,000 
Resíduo 89,450 98 0,913 
Total 140,628 99 
Variáveis introduzidas no modelo de regressão 
Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 
Variáveis introduzidas B padrão Beta Sig. zero Parcial parcial Tolerância  VIF 
(Constante) 3,680 0,443 8,310 0,000 
X Solução de reclamação 0,595 0,079 0,603 7,488 0,000 0,603 0,603 0,603 1,000 1,000 
Variáveis fora do modelo de regressão 
Significância Estatísticas de 
estatística Correlação colinearidade 
Beta t Sig. parcial Tolerância  VIF 
X, Qualidade do produto 0,427 6,193 0,000 0,532 0,989 1,011 
X, Comércio eletrônico 0,202 2,553 0,012 0,251 0,980 1,020 
X Suporte técnico 0,055 0,675 0,501 0,068 0,991 1,009 
Xo Anúncio 0,193 2410 0,018 0,238 0,961 1,040 
X, Linha do produto 0,309 3,338 0,001 0,321 0,685 1,460 
X, Imagem da equipe de venda 0,382 5,185 0,000 0,466 0,947 1,056 
X, Preço competitivo -0,133 -1,655 0,101 -0,166 0,984 1,017 
X, Garantia e reclamações 0,095 1,166 0,246 0,118 0,980 1,020 
Xs Novos produtos 0,035 0,434 0,665 0,044 0,996 1,004 
X, Encomenda e cobrança 0,153 1,241 0,218 0,125 0,427 2,341 
X; Flexibilidade de preço -0,216 -2,526 0,018 -0,248 0,844 1,184 
Xe Velocidade de entrega 0,219 1,371 0,173 0,138 0,252 3,974 


Erro padrão do coeficiente. Oerro padrão do coefi- 
ciente de regressão é uma estimativa do quanto que o co- 
eficiente de regressão irá variar entre amostras do mesmo 
tamanho tomadas da mesma população. De uma maneira 
simples, é o desvio padrão das estimativas de b, ao longo 
de múltiplas amostras. Se tomássemos múltiplas amostras 
de mesmo tamanho da mesma população e as usássemos 
para calcular a equação de regressão, o erro padrão seria 
uma estimativa de quanto o coeficiente de regressão iria 
variar de amostra para amostra. Um erro padrão menor 
implica uma previsão mais confiável e, portanto, interva- 
los de confiança menores. 


O erro padrão de by é 0,079, denotando que o intervalo de 
confiança de 95% para by seria de 0,595 + (1,96 x 0,079), 
ou variando de um mínimo de 0,44 a um máximo de 0,75. 
O valor de b, dividido pelo erro padrão (0,595/0,079 = 
7,488) é o valor t calculado para um teste 1 da hipótese b, 
= 0 (ver a discussão a seguir). 


Valor t de variáveis na equação. O valor t de variá- 
veis na equação, como já calculado, mede a significância 
da correlação parcial da variável refletida no coeficiente 
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de regressão. Como tal, ele indica se o pesquisador pode 
confiantemente dizer, com um nível estabelecido de erro, 
que o coeficiente não é nulo. Valores F podem ser dados 
neste estágio ao invés de valores t. Eles são diretamente 
comparáveis, pois o valor t é aproximadamente a raiz qua- 
drada do valor F. 

O valor t é também particularmente útil no procedimen- 
to stepwise (ver Figura 4-7) para ajudar a determinar se al- 
guma variável deve ser descartada da equação uma vez que 
outra variável independente tenha sido acrescentada. O ní- 
vel calculado de significância é comparado com o nível de 
referência estabelecido pelo pesquisador para descartar a 
variável. Em nosso exemplo, estabelecemos um nível de 0,10 
para a eliminação de variáveis da equação. O valor crítico 
para um nível de significância de 0,10 com 98 graus de liber- 
dade é 1,658. À medida que mais variáveis são adicionadas 
à equação de regressão, cada variável é checada para que se 
examine se a mesma ainda está dentro dessa referência. Se 
cair fora (significância maior do que 0,10), é eliminada da 
equação de regressão, e o modelo é novamente estimado. 


Em nosso exemplo, o valor t (como obtido pela divisão 
do coeficiente de regressão pelo erro padrão) é 7,488, 
que é estatisticamente significante no nível 0,000. Ele dá 
ao pesquisador um elevado nível de segurança de que o 
coeficiente não é igual a zero e pode ser avaliado como 
um preditor de satisfação de cliente. 


Correlações. Três diferentes correlações são dadas 
como uma ajuda na avaliação do processo de estimação. A 
correlação de ordem zero é a correlação bivariada simples 
entre a variável independente e a dependente. A correla- 
ção parcial denota o efeito preditivo incremental de uma 
variável independente sobre a dependente controlando 
outras variáveis no modelo de regressão. Essa medida é 
empregada para julgar qual variável é adicionada a seguir 
em métodos de busca segiiencial. Finalmente, a correla- 
ção semiparcial corresponde ao efeito único atribuível a 
cada variável independente. 


Para o primeiro passo em uma solução stepwise, todas as 
três correlações são idênticas (0,603) pois nenhuma outra 
variável está na equação. À medida que variáveis forem 
acrescentadas, esses valores se tornarão diferentes, cada um 
refletindo suas perspectivas sobre a contribuição de cada va- 
riável independente ao modelo de regressão. 


Estatística de colinearidade. Ambas as medidas 
de colinearidade (tolerância e VIF) são dadas para for- 


necerem uma perspectiva sobre o impacto de colineari- 
dade nas variáveis independentes da equação de regres- 
são. Lembre-se que o valor de tolerância é a quantia de 
capacidade preditiva de uma variável independente que 
não é prevista pelas demais variáveis independentes na 
equação. Assim, ele representa a variância única rema- 
nescente para cada variável. O VIF é o inverso do valor 
de tolerância. 


No caso de uma única variável no modelo de regressão, 
a tolerância é 1,00, indicando que é totalmente não afe- 
tada por outras variáveis independentes (como deveria 
ser, uma vez que é a única variável no modelo). Além 
disso, o VIF é 1,00, ambos os valores indicando uma 
completa falta de multicolinearidade. 


Variáveis fora da equação. Com X incluída na equação 
de regressão, 12 outras variáveis potencialmente indepen- 
dentes permanecem para serem incluídas de modo a me- 
lhorar a previsão da variável dependente. Para tais valo- 
res, quatro tipos de medidas estão disponíveis para avaliar 
sua potencial contribuição ao modelo de regressão: cor- 
relações parciais, medidas de colinearidade, coeficientes 
padronizados (Beta) e valores t. 


Medidas de correlação parcial e colinearidade. A 
correlação parcial é uma medida da variação em Y que 
pode ser explicada por conta de cada variável adicional, 
controlando as variáveis já presentes na equação (apenas 
X, no passo 1). Como tais, os métodos de busca segien- 
cial usam esse valor para denotar o próximo candidato à 
inclusão. Se a variável com a maior correlação parcial ex- 
ceder a referência de significância estatística exigida para 
inclusão, será adicionada ao modelo de regressão no pró- 
ximo passo. 

A correlação parcial representa a correlação de cada 
variável não presente no modelo com a porção inexplica- 
da da variável dependente. Dessa forma, a contribuição 
da correlação parcial (o quadrado da correlação parcial) 
é aquele percentual da variância não-explicada que passa 
a ser explicada com o acréscimo desta variável indepen- 
dente. Considere que as variáveis no modelo de regressão 
já explicam 60% da medida dependente (Rº = 0,60 com 
variância não-explicada igual a 0,40). Se uma correlação 
parcial tem um valor de 0,5, então a variância explicada 
extra correspondente é o quadrado da correlação parcial 
vezes a quantia inexplicada de variância. Neste exemplo 
simples, temos 0,52 x 0,40, ou 10%. Acrescentando essa 
variável, esperamos que o valor Rº aumente 10% (de 0,60 
para 0,70). 
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Para nosso exemplo, os valores de correlações parciais 
variam de um máximo de 0,532 a um mínimo de 0,044. 
X,, com o maior valor de 0,532, deveria ser a próxima 
variável a entrar se for descoberto que tal correlação 
parcial é estatisticamente significante (ver a próxima se- 
ção). É interessante observar, porém, que X, tinha ape- 
nas a sexta maior correlação bivariada com X,,. Por que 
ela foi a segunda variável a entrar na equação stepwise, 
à frente das variáveis com maiores correlações? As va- 
riáveis com a segunda, terceira e quarta maior correla- 
ção com X, eram X,, (0,577), X,, (0,551) e Xe (0,522). 
Ambas X,, e X,, tinham elevadas correlações com X,, 
refletidas em seus baixos valores de tolerância de 0,252 
e 0,427, respectivamente. Deve ser notado que esse ele- 
vado nível de multicolinearidade não é inesperado, pois 
essas três variáveis (X,, X,, € X,;) constituem o primeiro 
fator obtido no Capítulo 3. X,,, apesar de não ter feito 
parte deste fator, está altamente correlacionada com X, 
(0,561) na medida em que a tolerância é de apenas 0,685. 
Finalmente, X,,, a quinta maior correlação bivariada 
com X,,, tem uma correlação com X, de apenas 0,230, 
mas que foi suficiente para tornar a correlação parcial 
ligeiramente menor do que a de X,. A correlação de X, e 
X, de apenas 0,106 resultou em uma tolerância de 0,989 
e transformou a correlação bivariada de 0,486 em uma 
correlação parcial de 0,532, a qual era a mais alta entre 
todas as demais 12 variáveis. 

Se X, for acrescentada, então o valor Rº deve aumen- 
tar o equivalente ao quadrado da correlação parcial ve- 
zes a variância não-explicada (variação em R? = 0,532” x 
0,636 = 0,180). Como 36,4% já foi explicado por X,, X, 
pode explicar apenas 18,0% da variância remanescente. 
Um diagrama de Vemn ilustra este conceito. 

A área sombreada de X, como uma proporção da 
área sombreada de Y representa a correlação parcial de 
X, com Y dada X,. A área sombreada, como uma pro- 
porção de Y, denota a variância incremental explicada 
por X, dado que X, já está na equação. 
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Note que variância total explicada (todas as áreas 
que se sobrepõem para Y) só não é igual às áreas asso- 
ciadas com as correlações parciais de X, e X,. Parte da 
explicação é proveniente dos efeitos compartilhados de 
X, e X,. Os efeitos compartilhados são denotados pela 
seção média onde essas duas variáveis se sobrepõem en- 
tre sie com Y. O cálculo da variância única associada 


com o acréscimo de X, pode também ser determinado 
através da correlação semiparcial, como descrito no 
Adendo 4.1. 


Coeficientes padronizados. Para cada variável fora 
da equação, o coeficiente padronizado (Beta) que a va- 
riável teria se fosse incorporada à mesma é calculado. 
Desse modo, o pesquisador pode avaliar a magnitude re- 
lativa desta variável se acrescentada àquelas já presentes 
na equação. Além disso, isso permite uma avaliação de 
significância prática em termos de poder preditivo relati- 
vo da variável adicionada. 


Na Tabela 4-11, percebemos que X,, a variável com mais 
alta correlação parcial, tem também o mais alto coefi- 
ciente Beta se adicionada. Ainda que a magnitude de 
0,427 seja substancial, pode também ser comparada com 
o beta para a variável agora no modelo (X, com um beta 
de 0,603), indicando que X, fará uma contribuição subs- 
tancial à explicação do modelo de regressão, bem como à 
sua capacidade preditiva. 


Valores t de variáveis fora da equação. O valor t 
mede a significância das correlações parciais para variá- 
veis fora da equação. Elas são calculadas como uma razão 
da soma adicional de quadrados explicada pela inclusão 
de uma variável particular com a soma de quadrados após 
acrescentar aquela mesma variável. Se esse valor t não ex- 
ceder um nível de significância especificado (p.ex., 0,05), a 
variável não poderá entrar na equação. O valor t tabelado 
para um nível de significância de 0,05 com 97 graus de li- 
berdade é 1,98. 


Olhando para a coluna de valores t na Tabela 4-11, no- 
tamos que seis variáveis (X,, X,, X o X 1, Xp e X1) ex- 
cedem esse valor e são candidatas à inclusão. Apesar 
de serem todas significantes, a variável adicionada será 
aquela com a maior correlação parcial. Devemos obser- 
var que estabelecer a referência de significância estatís- 
tica antes que uma variável seja adicionada inviabiliza o 
acréscimo de variáveis sem significância, ainda que elas 
aumentem o Rº geral. 


Olhando adiante. Com o primeiro passo do procedi- 
mento stepwise completado, a tarefa final é avaliar as 
variáveis fora da equação e determinar se outra variável 
atende aos critérios e se pode ser acrescentada ao mo- 
delo de regressão. Como anteriormente observado, a 
correlação parcial deve ser grande o bastante para ser 
estatisticamente significante no nível especificado (geral- 
mente 0,05). Se duas ou mais variáveis atendem tal cri- 
tério, então a variável com a maior correlação parcial é 
escolhida. 
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Como descrito anteriormente, X, (Qualidade do produ- 
to) apresenta a maior correlação parcial neste estágio, 
mesmo que outras quatro variáveis tenham correlações 
bivariadas maiores com a variável dependente. Em cada 
caso, multicolinearidade com X,, adicionada no primeiro 
passo, fez com que as correlações parciais diminuíssem 
abaixo daquela de X,. 

Sabemos que uma porção significativa da variância na 
variável dependente é explicada por X,, mas o procedi- 
mento stepwise indica que se adicionamos X, ao maior co- 
eficiente de correlação parcial com a variável dependente 
e um valor t significante no nível 0,05, faremos um aumen- 
to significante no poder preditivo do modelo de regressão 
geral. Assim, podemos agora olhar o novo modelo usan- 
do ambas X, e X,. 


Estimação stepwise: adição de 

uma segunda variável (X,) 

O próximo passo em uma estimação stepwise é checar e des- 
cartar qualquer variável na equação que agora fique abaixo 
do valor de referência de significância, e, uma vez feito isso, 
adicionar a variável com a mais alta correlação parcial esta- 
tisticamente significante. A seção a seguir detalha o recém 
formado modelo de regressão e as questões referentes a seu 
ajuste geral, os coeficientes estimados, o impacto de multico- 
linearidade e a identificação de uma variável a acrescentar 
no próximo passo. 


Ajuste geral do modelo. Como descrito na seção ante- 
rior, X, foi a próxima variável a ser adicionada ao modelo 
de regressão no procedimento stepwise. Os valores múlti- 
plos R e Rº aumentaram com a adição de X, (ver Tabela 
4-12). O Rº aumentou em 18,0%, a quantia que previmos 
quando examinamos o coeficiente de correlação parcial de 
X, de 0,532, multiplicando os 63,6% de variação que não 
era explicada depois do passo 1, pela correlação parcial ao 
quadrado (63,6 x 0,532 = 18,0). Em seguida, dos 63,3% * 
inexplicados com X,, (0,532) dessa variância foi explicada 
pelo acréscimo de X,, levando a uma variância total expli- 
cada (R?) de 0,544. O Rº ajustado também aumentou para 
0,535, e o erro padrão da estimativa diminuiu de 0,955 para 
0,813. Ambas as medidas demonstram também a melhora 
no ajuste geral do modelo. 


Coeficientes estimados. O coeficiente de regressão para 
X, é 0,364 e o peso beta é 0,427. A despeito de não ser 
tão grande quanto o beta para X, (0,558), X, ainda tem 
um substancial impacto no modelo de regressão geral. O 
coeficiente é estatisticamente significante, e a multicoline- 
aridade é mínima com X, (como descrito na seção ante- 
rior). Logo, tolerância é bastante aceitável com um valor 


de 0,989 indicando que somente 1,1% de qualquer variável 
é explicado pela outra. 


Impacto de multicolinearidade. A falta de multicolineari- 
dade resulta em pouca mudança para o valor de b, (0,550) 
ou o beta de X, (0,558) em relação ao passo 1. Também 
indica que as variáveis X, e X, são relativamente indepen- 
dentes (a correlação simples entre as duas é de 0,106). Se 
o efeito de X, sobre Y fosse totalmente independente do 
efeito de X,, o coeficiente b, não mudaria de forma alguma. 
Os valores t indicam que X, e X, são preditores estatistica- 
mente significantes de Y. O valor t para X, é agora 8,092, 
enquanto no passo 1 era 7,488. O valor t para X, examina a 
contribuição dessa variável dado que X,** já está na equa- 
ção. Note que o valor t para X, (6,193) é o mesmo valor 
mostrado para X, no passo 1 sob o título “Variáveis fora do 
modelo de regressão” (ver Tabela 4-11). 


Identificação de variáveis para acrescentar. Como X,e 
X, têm contribuições significantes, nenhuma será elimina- 
da no procedimento de estimação stepwise. Podemos ago- 
ra perguntar: “há outros preditores disponíveis?”. Para 
abordar essa questão, podemos olhar na Tabela 4-12 sob a 
seção “Variáveis fora do modelo de regressão”. 


Olhando as correlações parciais para as variáveis fora 
da equação na Tabela 4-12, percebemos que X,, tem a 
maior correlação parcial (0,676), a qual é também es- 
tatisticamente significante no nível 0,000. Essa variável 
explicaria 45,7% da variância (0,676 = 0,457), até então 
inexplicada, ou 20,9% da variância total (0,676 x 0,456). 
Essa substancial contribuição na verdade ultrapassa li- 
geiramente a contribuição incremental de X,, a segunda 
variável adicionada no procedimento stepwise. 


Estimação stepwise: uma terceira 

variável (X,,) é adicionada 

O próximo passo em uma estimação stepwise segue o mes- 
mo padrão de (1) primeiro checar e eliminar variáveis na 
equação que estão abaixo da significância de referência 
e então (2) adicionar a variável com a maior correlação 
parcial estatisticamente significante. A seção a seguir de- 
talha o modelo de regressão recém formado e as questões 
relativas a seu ajuste geral, os coeficientes estimados, o 
impacto de multicolinearidade, e a identificação de uma 
variável a acrescentar no próximo passo. 


Ajuste geral do modelo. Com X, na equação de re- 
gressão, os resultados são exibidos na Tabela 4-13. 
Como previsto, o valor de Rº aumenta em 20,9% (0,753 
— 0,544 = 0,209). Além disso, o Rº ajustado aumenta para 


(Continua) 


* N.de R.T.: A frase correta seria “dos 63% inexplicados com Xç”. 


** N. de R.T.: A frase correta seria “dado que X, já está na equação”. 
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TABELA 4-12 Exemplo de resultado: passo 2 do exemplo da regressão múltipla HBAT 


Passo 2 — Variável incluída: X, Qualidade do produto 


R múltiplo 0,738 
Coeficiente de determinação (R?) 0,544 
Rº ajustado 0,535 
Erro padrão da estimativa 0,813 


Análise de variância 


Soma de 
quadrados df Quadrado médio F Sign. 
Regressão 76,527 2 38,263 57,902 0,000 
Resíduo 64,101 97 0,661 
Total 140,628 99 
Variáveis incluídas no modelo de regressão 
Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 
Variáveis incluídas B padrão Beta t Sig. zero Parciais parciais Tolerância  VIF 
(Constante) 1,077 0,564 1,909 0,059 
X Solução de reclamação 0,550 0,068 0,558 8,092 0,000 0,603 0,635 0,555 0,989 1,011 
X, Qualidade do produto 0,364 0,059 0,427 6,193 0,000 0,486 0,532 0,425 0,989 1,011 
Variáveis fora do modelo de regressão 
Significância Estatística de 
estatística Correlação colinearidade 
Beta t Sig. parcial Tolerância  VIF 
X, Comércio eletrônico 0,275 4,256 0,000 0,398 0,957 1,045 
X; Suporte técnico 0,018 0,261 0,794 0,027 0,983 1,017 
Xo Anúncio 0,228 3432 0,001 0,330 0,956 1,046 
X, Linha de produto 0,066 0,683 0,496 0,070 0,508 1,967 
X, Imagem da equipe de venda 0,477 8,992 0,000 0,676 0,916 1,092 
X, Preço competitivo 0,041 0,549 0,584 0,056 0,832 1,202 
X Garantia e reclamações 0,063 0,908 0,366 0,092 0,975 1,026 
Xs Novos produtos 0,026 0,382 0,703 0,039 0,996 1,004 
Xj, Encomenda e cobrança 0,129 1,231 0,221 0,125 0,427 2,344 
X Flexibilidade de preço 0,084 0,909 0,366 0,092 0,555 1,803 
X,s Velocidade de entrega 0,334 2487 0,015 0,246 0,247 4,041 


(Continuação) 
0,745 e o erro padrão da estimativa diminui para 0,602. 
Novamente, como aconteceu com X, no passo anterior, 
a nova variável computada (X,,) faz substancial contri- 
buição ao ajuste geral do modelo. 


Coeficientes estimados. A adição de X,, trouxe um 
terceiro preditor estatisticamente significante da satisfa- 
ção de cliente na equação. O peso de regressão de 0,530 
é completado por um peso beta de 0,477, o segundo 
maior entre as três variáveis no modelo (atrás do 0,512 
de X,). 


Impacto de multicolinearidade. Vale notar que mes- 
mo com a terceira variável na equação de regressão, 
multicolinearidade é mantida mínima. O menor valor 
de tolerância é para X,, (0,916), indicando que apenas 


8,4% da variância de X,, é explicada pelas outras duas 
variáveis. Esse padrão de variáveis entrando no proce- 
dimento stepwise deve ser esperado, porém, quando 
visto sob a perspectiva da análise fatorial feita no Capí- 
tulo 2. A partir daqueles resultados, percebemos que as 
três variáveis agora presentes na equação (X,, X, e X,) 
eram elementos de diferentes fatores naquela análise. 
Como variáveis no mesmo fator exibem um elevado 
grau de multicolinearidade, espera-se que quando uma 
variável de um fator entra em uma equação de regres- 
são, as chances de outra variável do mesmo fator en- 
trarem na equação são pequenas (e se isso ocorrer, o 
impacto das duas variáveis será reduzido devido à mul- 
ticolinearidade). 


(Continua) 


CAPÍTULO 4 Análise de Regressão Múltipla 205 


(Continuação) , ; 
Olhando adiante. Neste estágio da análise, somente 


três variáveis (X,, X,, e X,,) têm as correlações parciais 
estatisticamente significantes necessárias para inclusão 
na equação de regressão. O que aconteceu com o poder 
preditivo das demais variáveis? Revendo as correlações 
bivariadas de cada variável com X, na Tabela 4-10, po- 
demos ver que entre as 13 variáveis independentes origi- 
nais, três tinham correlações bivariadas não-significantes 
com a variável dependente (X,, X,, e X,;). Logo, X o, X,a, 
X,, e X,, têm correlações bivariadas significantes, ainda 
que suas correlações parciais sejam agora não-significan- 
tes. Para X,,, a elevada correlação bivariada de 0,522 foi 
sensivelmente reduzida pela alta multicolinearidade (va- 
lor de tolerância de 0,426, denota que menos da metade 
do poder preditivo original se manteve). Para as outras 
três variáveis, X,o, X,; e X,, suas correlações bivariadas 
menores (0,305, -0,208 e 0,178) foram reduzidas pela mul- 
ticolinearidade o suficiente para serem não-significantes. 


Neste estágio pularemos para o modelo final de regres- 
são e detalharemos a entrada das duas variáveis finais (X, 
e X,,) em um único estágio para fins de concisão. 


Estimação stepwise: quarta e quinta 

variáveis (X, e X,,) são adicionadas 

O modelo final de regressão (Tabela 4-14) é o resultado 
de duas variáveis a mais (X, e X,,) sendo adicionadas. 
Para fins de concisão, omitimos os detalhes envolvidos na 
entrada de X. e concentramos a atenção sobre o modelo 
final de regressão com ambas as variáveis incluídas. 


é substancial. Das cinco variáveis na equação, três delas 
(X,, X,e X,,) têm valores de tolerância menores do que 
0,50, indicando que mais da metade de sua variância é 
explicada pelas demais variáveis na equação. Além dis- 
so, essas variáveis foram as últimas três a entrarem no 
processo stepwise. 

Se examinarmos as correlações de ordem zero (bi- 
variadas) e parciais, podemos ver mais diretamente os 
efeitos da multicolinearidade. Por exemplo, X,, tem a 
terceira mais alta correlação bivariada (0,551) entre to- 
das as 13 variáveis, ainda que multicolinearidade (tole- 
rância de 0,492) a reduza para uma correlação parcial 
de apenas 0,135, tornando-a um contribuinte marginal 
para a equação de regressão. Em contraste, X,, tem uma 
correlação bivariada (0,500) que mesmo com elevada 
multicolinearidade (tolerância de 0,347) ainda tem uma 
correlação parcial de 0,411. Assim, multicolinearidade 
sempre afetará a contribuição de uma variável ao mode- 
lo de regressão, mas deve ser examinada para se avaliar 
o real grau de impacto. 

Se tomarmos uma perspectiva mais ampla, as variá- 
veis incluídas entrando na equação de regressão corres- 
pondem quase exatamente aos fatores derivados no Ca- 
pítulo 3. X, e X, são elementos de fatores distintos, com 
multicolinearidade reduzindo as correlações parciais de 
outros membros desses fatores a um nível não-signifi- 
cante. X,, e X, são ambos membros de um terceiro fator, 
mas multicolinearidade provocou uma mudança no sinal 
do coeficiente estimado para X, (ver uma discussão mais 
detalhada no estágio 5). Finalmente, X,, não carregou 
sobre qualquer um dos fatores, mas foi um contribuinte 
periférico no modelo de regressão. 


Ajuste geral do modelo. O modelo final de regressão 
com cinco variáveis independentes (X, X,, X» X, e X,) 
explica quase 80% da variância da satisfação de cliente 
(X,0). O Rº ajustado de 0,780 indica nenhum superajuste 
do modelo e que os resultados devem ser generalizáveis 
sob a perspectiva da proporção de observações em rela- 
ção às variáveis na equação (20:1 para o modelo final). 
Além disso, o erro padrão da estimativa foi reduzido 
para 0,559, o que significa que no nível de 95% de con- 
fiança (+ 1,96 x erro padrão da estimativa), a margem de 
erro para qualquer valor previsto de X,, pode ser calcu- 
lada como sendo + 1,1. 


Coeficientes estimados. Os cinco coeficientes de re- 
gressão, mais a constante, são todos significantes no 
nível 0,05, e todos, exceto a constante, são significantes 
no nível 0,01. A próxima seção (estágio 5) fornece uma 
discussão mais detalhada dos coeficientes de regressão e 
beta, uma vez que eles se relacionam com a interpreta- 
ção da variável estatística. 


Impacto de multicolinearidade. O impacto de multico- 
linearidade, mesmo entre apenas essas cinco variáveis, 


O impacto de multicolinearidade como refletido na 
estrutura fatorial se torna mais aparente quando se usa 
um procedimento de estimação stepwise, e será discutido 
com mais detalhes no quinto estágio. Não obstante, fora 
questões de explicação, multicolinearidade pode ter um 
substancial impacto sobre a habilidade preditiva geral de 
qualquer conjunto de variáveis independentes. 


Olhando adiante. Como previamente observado, o 
modelo de regressão neste estágio consiste das cinco 
variáveis independentes com o acréscimo de X,,. Exa- 
minando as correlações parciais de variáveis fora do 
modelo neste estágio (ver Tabela 4-14), percebemos 
que nenhuma das variáveis remanescentes tem uma 
correlação parcial significante no nível 0,05 necessário 
para entrada. Além disso, todas as variáveis no mode- 
lo permanecem estatisticamente significantes, evitando 
a necessidade de remover uma variável no processo 
stepwise. Logo, nenhuma outra variável é considerada 
para entrada ou saída, e o modelo está finalizado. 
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TABELA 4-13 Exemplo de resultado: passo 3 do exemplo da regressão múltipla HBAT 


Passo 3 — Variável incluída: X,, Imagem da equipe de venda 


R múltiplo 0,868 
Coeficiente de determinação (R?) 0,753 
Rº ajustado 0,745 
Erro padrão da estimativa 0,602 


Análise de variância 


Soma de 
quadrados df Quadrado médio F Sig. 
Regressão 105,833 3 35,278 97,333 0,000 
Resíduo 34,794 96 0,362 
Total 140,628 99 
Variáveis incluídas no modelo de regressão 
Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 
Variáveis incluídas B padrão Beta t Sig. zero Parciais parciais Tolerância  VIF 
(Constante) -1,569 0,511 -3,069 0,003 
X Solução de reclamação 0,433 0,052 0,439 8,329 0,000 0,603 0,648 0,423 0,927 1,079 
X; Qualidade do produto 0,437 0,044 0,512 9,861 0,000 0,486 0,709 0,501 0,956 1,046 
X,> Imagem da equipe de venda 0,530 0,059 0,477 8,992 0,000 0,500 0,676 0,457 0,916 1,092 
Variáveis fora do modelo de regressão 
Significância Estatísticas de 
estatística Correlação colinearidade 
Beta t Sig. parcial Tolerância  VIF 
X, Comércio eletrônico -0,232 -2,890 0,005 -0,284 0,372 2,692 
X Suporte técnico 0,013 0,259 0,796 0,027 0,983 1,017 
Xo Anúncio -0,019 -0,307 0,760 -0,031 0,700 1,428 
X, Linha de produto 0,180 2,559 0,012 0,254 0,494 2,026 
X, Preço competitivo -0,094 -1,643 0,104 -0,166 0,776 1,288 
X, Garantia e reclamações 0,020 0,387 0,700 0,040 0,966 1,035 
Xs Novos produtos 0,016 0,312 0,755 0,032 0,996 1,004 
Xe Encomenda e cobrança 0,101 1,297 0,198 0,132 0,426 2,948 
X Flexibilidade de preço -0,063 -0,892 0,374 -0,091 0,525 1,906 
Xe Velocidade de entrega 0,219 2172 0,032 0,217 0,243 4,110 


Uma revisão do processo stepwise 

O procedimento de estimação stepwise é planejado para 
desenvolver um modelo de regressão com o menor número 
de variáveis independentes estatisticamente significantes e 
o máximo de precisão preditiva. No entanto, fazendo isso, 
o modelo de regressão pode ser sensivelmente afetado por 
questões como multicolinearidade. Além disso, o pesquisa- 
dor abre mão de controle sobre a formação do modelo de 
regressão e corre um risco maior de diminuir generalidade. 
A seção a seguir fornece uma visão geral da estimação do 
modelo de regressão stepwise discutido anteriormente sob 
a perspectiva de ajuste geral do modelo. Aspectos relativos 
à interpretação da variável estatística, outros procedimen- 
tos de estimação, e especificações alternativas de modelo 
serão abordadas em seções subsegiientes. 


A Tabela 4-15 fornece um resumo passo a passo deta- 
lhando as medidas de ajuste geral para o modelo de 
regressão usado pela HBAT na previsão de satisfação 
de clientes. Cada uma das três primeiras variáveis adi- 
cionadas à equação faz contribuições substanciais ao 
ajuste geral do modelo, com significativos aumentos no 
Rº e no Rº ajustado, ao mesmo tempo em que diminui o 
erro padrão da estimativa. Com apenas as três primei- 
ras variáveis, 75% da variação em satisfação de cliente é 
explicada com um intervalo de confiança de + 1,2. Duas 
variáveis adicionais foram acrescentadas para chegar no 
modelo final, mas essas variáveis, apesar de estatistica- 
mente significantes, fazem contribuições muito menores. 


(Continua) 
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TABELA 4-14 Exemplo de resultado: passo 5 do exemplo da regressão múltipla HBAT 


Passo 5 — Variável incluída: X,, Linha do produto 


R múltiplo 0,889 
Coeficiente de determinação (R?) 0,791 
FÊ ajustado 0,780 
Erro padrão da estimativa 0,559 
Análise de variância 
Soma de 
quadrados df Quadrado médio F Sig. 
Regressão 111,205 5 22,241 71,058 0,000 
Resíduo 29,422 94 0,313 
Total 140,628 99 
Variáveis incluídas no modelo de regressão 
Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 
Variáveis incluídas B padrão Beta t Sig. zero Parciais parciais Tolerância  VIF 
(Constante) - 1,151 0,500 -2,303 0,023 
X, Solução de reclamação 0,319 0,061 0,323 5,256 0,000 0,603 0,477 | 0,248 0,588 1,701 
X, Qualidade do produto 0,369 0,047 0,432 7,820 0,000 0,486 0,628 0,369 0,728 1,373 
X,» Imagem de equipe de venda 0,775 0,089 0,697 8,711 0,000 0,500 0,668 0,411 0,347 2,880 
X, Comércio eletrônico -0,417 0,132 -0,245 -3,162 0,002 0,283 -0,310 -0,149 0,370 2,701 
X, Linha do produto 0,174 0,061 0,192 2,860 0,005 0,551 0,283 0,135 0,492 2,033 
Variáveis fora do modelo de regressão 
Significância Estatísticas de 
estatística Correlação colinearidade 
Beta t Sig. parcial Tolerância  VIF 
X, Suporte técnico -0,009 -0,187 0,852 -0,019 0,961 1,041 
Xo Anúncio -0,009 -0,162 0,872 -0,017 0,698 1,432 
X, Preço competitivo -0,040 -0,685 0,495 -0,071 0,667 1,498 
X, Garantia e reclamações -0,023 -0,462 0,645 -0,048 0,901 1,110 
Xs Novos produtos 0,002 0,050 0,960 0,005 0,989 1,012 
Xe Encomenda e cobrança 0,124 1,727 0,088 0,176 0,423 2,366 
X Flexibilidade de preço 0,129 1,429 0,156 0,147 0,272 3,674 
Xs Velocidade de entrega 0,138 1,299 0,197 0,133 0,197 5,075 


(Continuação) 
O Rº aumenta em 3% e o intervalo de confiança diminui 
para + 1,1, o que corresponde a uma melhora de 0,1. Os 
impactos relativos de cada variável serão discutidos no 
estágio 5, mas o procedimento stepwise destaca a impor- 
tância das três primeiras variáveis na avaliação do ajuste 
geral do modelo. 


Ao avaliarmos a equação estimada, consideramos 
significância estatística. Devemos também tratar com 
às duas questões básicas: (1) atender às suposições ine- 
rentes à regressão e (2) identificar os pontos influentes. 
Consideramos cada um desses tópicos nas seções que se 
seguem. 


Avaliação da variável estatística para as 
suposições da análise de regressão 

Até aqui, examinamos as variáveis individuais para saber- 
mos se as mesmas atendem às suposições exigidas para 
análise de regressão. Contudo, devemos avaliar a variável 
estatística para sabermos se ela atende a tais suposições 
também. As suposições a serem examinadas são lineari- 
dade, homocedasticidade, independência dos resíduos, e 
normalidade. A principal medida usada na avaliação da 
variável estatística de regressão é o resíduo — a diferen- 
ça entre o valor real da variável dependente e seu valor 
previsto. Para comparação, usamos os resíduos estudanti- 
zados, uma forma de resíduos padronizados (ver Termos- 
chave). 
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TABELA 4-15 Resumo do modelo segundo o método de regressão múltipla stepwise 


Resumo do modelo 


Ajuste geral do modelo Estatísticas de mudança no R 
Valor F para Significân- 
Erro padrão Mudança mudança cia da mu- 
Passo R R R' ajustado da estimativa no RÉ no RÉ dft df2 dança no Rº 
1 0,603 0,364 0,357 0,955 0,364 56,070 1 98 0,000 
2 0,738 0,544 0,535 0,813 0,180 38,359 1 97 0,000 
3 0,868 0,753 0,745 0,602 0,208 80,858 1 96 0,000 
4 0,879 0,773 0,763 0,580 0,020 8,351 1 95 0,005 
5 0,889 0,791 0,780 0,559 0,018 8,182 1 94 0,005 
Passo 1: X, Solução de reclamação 
Passo 2: X, Solução de reclamação, X, Qualidade do produto 
Passo 3: X, Solução de reclamação, X, Qualidade do produto, X,, Imagem da equipe de venda 
Passo 4: X, Solução de reclamação, X, Qualidade do produto, X,, Imagem da equipe de venda, X, Comércio eletrônico 
Passo 5: X, Solução de reclamação, X, Qualidade do produto, X,, Imagem da equipe de venda, X, Comércio eletrônico, 
X, Linha de produto 


Nota: Constante (termo de intercepto) incluída em todos os modelos de regressão. 


O tipo mais básico de gráfico de resíduo é mostrado na Mas também devemos nos certificar, ao usarmos mais de 


Figura 4-10, os resíduos estudantizados versus os valores 
previstos. Como podemos ver, os resíduos geralmente es- 
tão em um padrão aleatório, muito semelhante ao gráfico 
nulo na Figura 4-5a. No entanto, devemos fazer testes es- 
pecíficos para cada suposição para verificar violações. 


uma variável independente, que cada relação com a variá- 
vel independente seja igualmente linear para garantir sua 
melhor representação na equação. Para fazer isso, utiliza- 
mos o gráfico de regressão parcial para cada variável in- 
dependente na equação. Na Figura 4-11, vemos que as re- 


lações para X,, X,e X, são razoavelmente bem definidas; 
ou seja, elas têm efeitos fortes e significantes na equação 
de regressão. As variáveis X, e X, não são tão bem defi- 
nidas, tanto no coeficiente angular quanto na dispersão 
dos pontos, o que explica o menor efeito na equação (evi- 
denciado pelo coeficiente, pelo valor beta e pelo nível de 
significância menores). Para as cinco variáveis, nenhum 
padrão não-linear é mostrado, atendendo assim à suposi- 
ção de linearidade para cada variável independente. 


Linearidade A primeira suposição, linearidade, será 
avaliada por meio de uma análise de resíduos (teste da 
variável estatística geral) e gráficos de regressão parcial 
(para cada variável independente na análise). 


A Figura 4-10 não exibe qualquer padrão não-linear nos 
resíduos, garantindo assim que a equação geral é linear. 


(Continua) 
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FIGURA 4-10 Análise de resíduos padronizados. 
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FIGURA 4-11 Gráficos de regressão parcial padronizada. 


(Continuação) 
Homocedasticidade A próxima suposição lida com a 


constância dos resíduos ao longo dos valores das variá- 
veis independentes. Nossa análise é novamente realizada 
pelo exame dos resíduos (Figura 4-10), que não mostra 
padrão de resíduos crescentes ou decrescentes. Essa des- 
coberta aponta homocedasticidade no caso multivariado 
(o conjunto de variáveis independentes). 


Independência dos resíduos A terceira suposição lida 
com o efeito de envolvimento de uma observação com a 
outra, tornando assim o resíduo não-independente. Quan- 
do é encontrado envolvimento em casos como dados em 
séries temporais, o pesquisador deve identificar as poten- 
ciais variáveis sequenciais (como tempo em um problema 
de séries temporais) e fazer o gráfico dos resíduos por essa 
variável. Por exemplo, considere que o número de identi- 


X; Atividades de comércio eletrônico 


Xj9 Satisfação 


XqyLinha de produto 


ficação representa a ordem na qual coletamos nossas res- 
postas. Poderíamos fazer o gráfico dos resíduos e ver se 
surge algum padrão. 


Em nosso exemplo, diversas variáveis, incluindo o núme- 
ro de identificação e cada variável independente, foram 
testadas e nenhum padrão consistente foi encontrado. 
Devemos usar os resíduos nessa análise, não os valores 
originais da variável dependente, porque o foco está nos 
erros de previsão e não na relação obtida na equação de 
regressão. 


Normalidade A suposição final que verificaremos é a 
normalidade do termo de erro da variável estatística com 
uma inspeção visual dos gráficos de probabilidade normal 
dos resíduos. 
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FIGURA 4-12 Gráfico de probabilidade normal: resíduos padronizados. 


Como mostrado na Figura 4-12, os valores estão ao lon- 
go da diagonal sem desvios substanciais ou sistemáticos; 
logo, os resíduos são considerados representativos de 
uma distribuição normal. A variável estatística de re- 
gressão satisfaz a suposição de normalidade. 


Aplicação de ações corretivas para violações de supo- 
sições. Após testar violações das quatro suposições 
básicas da regressão multivariada para as variáveis in- 
dividuais e para a variável estatística de regressão, o 
pesquisador deve avaliar o impacto de ações corretivas 
sobre os resultados. 


No exame de variáveis individuais no Capítulo 2, as úni- 
cas ações corretivas necessárias eram as transformações 
de X, X, X,, X,, X,,€ X,. Somente no caso de X,, a 
transformação não atingiu normalidade. Se substituirmos 
essas variáveis por seus valores originais e reestimarmos 
a equação de regressão com um procedimento stepwise, 
conseguiremos resultados quase idênticos (ver Tabela 
4-16). As mesmas variáveis entram na equação sem dife- 
renças significativas, seja nos coeficientes estimados, seja 
no ajuste geral do modelo como avaliado com R? e erro 
padrão da estimativa. As variáveis independentes fora da 
equação ainda exibem níveis não-significantes para en- 
trada —- mesmo aquelas que foram transformadas. Assim, 
nesse caso, as ações corretivas para violação das suposi- 
ções melhoraram um pouco a previsão, mas não altera- 
ram as descobertas importantes. 


Identificação de observações atípicas 

como observações influentes 

Para nossa análise final, tentamos identificar observações 
que sejam influentes (tenham um impacto desproporcio- 


nal sobre os resultados de regressão) e determinar se elas 
deveriam ser excluídas da análise. Apesar de procedimen- 
tos mais detalhados estarem disponíveis para a identifica- 
ção de observações atípicas como observações influentes, 
abordamos o uso de resíduos para identificar observações 
atípicas na próxima seção. 


A ferramenta diagnóstica mais básica envolve os resíduos 
e a identificação de quaisquer observações atípicas — ou 
seja, observações que não foram bem previstas pela equa- 
ção de regressão e que têm grandes resíduos. A Figura 
4-13 mostra os resíduos estudantizados para cada obser- 
vação. Como os valores correspondem a valores t, os li- 
mites superior e inferior podem ser definidos assim que o 
intervalo de confiança desejado tenha sido estabelecido. 
Talvez o nível mais amplamente usado seja uma confiança 
de 95% (o = 0,05). O valor t correspondente é 1,96, iden- 
tificando-se assim resíduos estatisticamente significantes 
como aqueles com resíduos maiores que este valor (1,96). 
Sete observações podem ser vistas na Figura 4-13 (2, 10, 
20, 45, 52, 80 e 99) como tendo resíduos significantes, e as- 
sim são classificadas como observações atípicas. Estas são 
importantes por serem observações não representadas 
pela equação de regressão por uma ou mais razões, sendo 
que qualquer uma pode ser um efeito influente sobre a 
equação que demanda uma ação corretiva. 

O exame dos resíduos também pode ser feito por 
meio dos gráficos de regressão parcial (ver Figura 4-11). 
Esses gráficos ajudam a identificar observações influen- 
tes para cada relação entre variáveis dependente e inde- 
pendentes. Consistentemente ao longo de cada gráfico 
na Figura 4-11, os pontos na porção inferior são aquelas 
observações identificadas como tendo elevados resíduos 
negativos (observações 2, 10, 20, 45, 52, 80 e 99 na Figura 
4-13). Tais pontos não são bem representados pela rela- 
ção e, portanto, afetam a correlação parcial também. 
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TABELA 4-16 Resultados de regressão múltipla após ações corretivas para violações de suposições 


Regressão stepwise com variáveis transformadas 


R múltiplo 0,890 
Coeficiente de determinação (R?) 0,792 
Rº ajustado 0,781 
Erro padrão da estimativa 0,558 
Análise de variância 
Soma de 
quadra- 
dos df Quadrado médio F Sig. 
Regressão 111,319 5 22,264 71,407 0,000 
Resíduo 29,308 94 0,312 
Total 140,628 99 
Variáveis incluídas no modelo de regressão 
Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 
Variáveis incluídas B padrão Beta t Sig. zero Parciais parciais Tolerância  VIF 
(Constante) 0,825 0,500 1,650 0,102 
X, Solução de reclamação 0,309 0,061 0,314 5,095 0,000 0,603 0,465 0,240 0,585 1,710 
X, Qualidade do produto 0,024 0,003 0,433 7,849 0,000 0,507 0,629 0,370 0,729 1,372 
Xp Imagem da equipe de venda 0,761 0,088 0,685 8,647 0,000 0,500 0,666 0,407 0,353 2,829 
X, Comércio eletrônico - 3,561 1,116 -0,244 -3,192 0,002 0,254  -0,313 -0,150 0,379 2,640 
X, Linha do produto 0,169 0,061 0,186 2,769 0,007 0,551 0,275 0,130 0,491 2,037 
Nota: X; (Qualidade do produto) e X, (Comércio eletrônico) são variáveis transformadas 
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FIGURA 4-13 Gráfico de resíduos estudantizados. 
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Análises mais detalhadas para verificar se alguma das 
observações pode ser classificada como influente, bem 
como avaliação de possíveis ações corretivas, estão no 
suplemento deste capítulo, disponível na Web em www. 
bookman.com.br. 


Estágio 5: Interpretação da variável 
estatística de regressão 


Com a estimação do modelo concluída, a variável estatís- 
tica de regressão especificada e os testes diagnósticos que 
confirmam a adequação dos resultados administrados, 
agora podemos examinar nossa equação preditiva baseada 
em cinco variáveis independentes (X,, X,, A, X, e X,). 
Interpretação dos coeficientes de regressão 

A primeira tarefa é avaliar os coeficientes de regressão 
quanto aos sinais estimados, concentrando-se naqueles de 
direção inesperada. 


A seção da Tabela 4-14 chamada “Variáveis incluídas no 
modelo de regressão” fornece a equação de previsão a 
partir da coluna rotulada “Coeficiente de regressão: B”. 
Dessa coluna, lemos o termo constante (-1,151) e os co- 
eficientes (0,319, 0,369, 0,775, 0,417 e 0,174) para X,, X,, 
X,, X,e X,, respectivamente. A equação preditiva seria 
escrita como: 


Y= 1,151 + 0,319X, + 0,369X, + 0,775X,, 
+ (= 041NX, + 0,174X, 


Nota: O coeficiente de X, está incluído entre parên- 
teses para evitar confusão devido ao valor negativo do 
mesmo. 


Com essa equação, o nível esperado de satisfação do 
cliente para qualquer um deles pode ser calculado se suas 
avaliações da HBAT forem conhecidas. Para ilustração, 
suponhamos que um cliente considerou a HBAT com 
um valor de 6,0 para cada uma dessas cinco medidas. O 
nível previsto de satisfação para aquele cliente seria 


Cliente previsto = —1,151 + 0,319 x 6 + 0,369 x 6 + 
0,775 x 6 + (—0,417) x 6 + 0,174 x 6 

1,151+ 1,914 + 2,214 + 4,650 — 
2,502 + 1,044 = 6,169 


Satisfação = 


Primeiro começamos com uma interpretação da cons- 
tante. Ela é estatisticamente significante (significância = 
0,023), fazendo assim uma importante contribuição à pre- 
visão. Contudo, como em nossa situação é altamente im- 
provável que qualquer respondente atribua nota zero em 
todas as percepções sobre a HBAT, a constante meramen- 
te participa do processo de previsão e não fornece qual- 
quer pista para interpretação. 

Ao se verem os coeficientes de regressão, o sinal é uma 
indicação da relação (positiva ou negativa) entre as variá- 
veis dependente e independentes. Todas as variáveis, exce- 


to uma, têm coeficientes positivos. De particular interesse 
é o sinal invertido de X, (Comércio eletrônico), sugerindo 
que um aumento em percepções sobre essa variável tem 
um impacto negativo sobre a satisfação prevista de cliente. 
Todas as demais variáveis têm coeficientes positivos, o que 
significa que percepções mais positivas de HBAT (valores 
maiores) aumentam a satisfação do cliente. 

De alguma forma, então, X, opera diferentemente das 
outras variáveis? Neste caso, a correlação bivariada entre 
X, e satisfação de cliente é positiva, indicando que, quando 
considerada separadamente, X, tem uma relação positiva 
com satisfação de cliente, exatamente como as outras va- 
riáveis. Discutiremos na próxima seção o impacto de mul- 
ticolinearidade sobre a inversão de sinais de coeficientes 
estimados. 


Avaliação da importância de variável 

Além de fornecer uma base para prever satisfação de 
cliente, os coeficientes de regressão também apresentam 
um meio de avaliar a importância relativa das variáveis 
individuais na previsão geral de satisfação de cliente. 
Quando todas as variáveis são expressas em uma escala 
padronizada, então os coeficientes de regressão represen- 
tam importância relativa. Não obstante, em outros casos, 
o peso beta é a medida preferida de importância relativa. 


Nessa situação, todas as variáveis são expressas na mes- 
ma escala, mas usaremos os coeficientes beta para com- 
parações entre variáveis independentes. Na Tabela 4-14, 
os coeficientes beta são listados na coluna chamada “Co- 
eficientes de regressão: Beta”. O pesquisador pode fazer 
comparações diretas entre as variáveis para se certificar 
de sua importância relativa na variável estatística de re- 
gressão. Para nosso exemplo, X,, (Imagem da equipe de 
venda) era a mais importante, seguida por X, (Qualidade 
do produto), X, (Solução de reclamação), X, (Comércio 
eletrônico) e, finalmente, X,, (Linha do produto). Com 
um firme declínio na magnitude dos coeficientes beta ao 
longo das variáveis, é difícil classificar as variáveis como 
elevadas, baixas ou qualquer outro caso. No entanto, a 
observação da magnitude relativa indica que, por exem- 
plo, X,, (Imagem da equipe de venda) exibe um efeito 
mais marcante (três vezes mais) do que X,, (Linha do 
produto). Assim, diante do fato de que a imagem da 
equipe de venda pode ser aumentada unicamente a partir 
de outras percepções, ela representa a forma mais direta, 
ceteris paribus*, de aumentar a satisfação do cliente. 


Medição do grau e impacto de multicolinearidade 
Em qualquer interpretação da variável estatística de re- 
gressão, o pesquisador deve estar ciente do impacto da 


* N. de R.T.: Esta expressão em latim significa “mantidas inalteradas 
as outras características”. 
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multicolinearidade. Como discutido anteriormente, va- 
riáveis altamente colineares podem distorcer substancial- 
mente os resultados ou torná-los muito instáveis e, assim, 
não-generalizáveis. Duas medidas estão disponíveis para 
testar o impacto da colinearidade: (1) cálculo dos valores 
da tolerância e VIF, e (2) uso dos índices de condição e 
decomposição da variância do coeficiente de regressão 
(ver suplemento deste capítulo disponível na Web em 
www.bookman.com.br para mais detalhes sobre este 
processo). O valor de tolerância é 1 menos a proporção 
da variância da variável explicada pelas outras variáveis 
independentes. Assim, uma alta tolerância indica pouca 
colinearidade, e valores de tolerância próximos de zero 
indicam que a variável é quase totalmente explicada pelas 
outras variáveis (alta multicolinearidade). O fator de in- 
flação de variância é o recíproco da tolerância; logo, pro- 
curamos valores VIF pequenos como indicativos de baixa 
intercorrelação entre as variáveis. 


Diagnóstico de multicolinearidade. Em nosso exem- 
plo, os valores de tolerância para as variáveis na equa- 
ção variam de 0,728 (X,) a 0,347 (X,,), indicando uma 
vasta gama de efeitos de multicolinearidade (ver Tabela 
4-14). Analogamente, os valores VIF variam de 1,373 a 
2,701. Ainda que nenhum desses valores indique níveis 
de multicolinearidade que devam distorcer seriamente a 
variável estatística de regressão, devemos ser cuidado- 
sos mesmo com tais níveis, para entender seus efeitos, 
especialmente sobre o processo de estimação stepwise. A 
seção a seguir detalha alguns desses efeitos tanto sobre a 
estimação quanto sobre o processo de interpretação. 


Uma segunda abordagem para identificar a multicoli- 
nearidade e seus efeitos é por meio da decomposição da 
variância do coeficiente. Os pesquisadores são encoraja- 
dos a explorar essa técnica e as informações adicionais 
que ela oferece na interpretação da equação de regres- 
são. Detalhes desse método são discutidos no suplemen- 
to deste capítulo dsisponível na Web em www.bookman. 
com.br. 


Impactos devido à multicolinearidade. Apesar de a mul- 
ticolinearidade não ser elevada a ponto de o pesquisador 
ter que tomar uma ação corretiva antes que resultados vá- 
lidos sejam obtidos, multicolinearidade ainda tem impac- 
to sobre o processo de estimação, particularmente sobre 
a composição da variável estatística e os coeficientes de 
regressão estimados. 


Depois de X, (a primeira variável acrescentada à variável 
estatística no processo stepwise), a segunda com maior 
correlação com a variável dependente é X,, (Velocidade 
de entrega), seguida por X,, (Linha do produto) e X,, 
(Encomenda e cobrança). No entanto, devido à colinea- 


ridade com X,, a segunda variável a entrar foi X,, que é 
apenas a sexta maior correlação bivariada com X,. 

Os impactos de multicolinearidade são vistos repeti- 
damente através do processo de estimação, de modo que 
o conjunto final de cinco variáveis adicionadas ao mode- 
lo de regressão (X,, X,, Xo, X, € X,) representa a pri- 
meira, a sexta, a quinta, a oitava e a terceira correlação 
com a variável dependente, respectivamente. Variáveis 
com a segunda correlação mais alta (X,; com 0,577) e a 
quarta maior (X,, com 0,522) jamais entram no modelo 
de regressão. A exclusão delas significa que as mesmas 
não são importantes? Falta impacto a elas? Se um pes- 
quisador se guiar apenas pelo modelo de regressão esti- 
mado, a multicolinearidade causará sérios problemas de 
interpretação. O que aconteceu é que X,, e X,, são alta- 
mente correlacionadas com X,, a tal ponto que elas têm 
pouco poder explanatório independentemente daque- 
le compartilhado com X,. No entanto, por conta delas 
mesmas, ou se X, não fosse permitida no modelo, elas 
seriam importantes preditores de satisfação de cliente. A 
extensão de multicolinearidade entre essas três variáveis 
é evidenciada no Capítulo 3, onde essas três variáveis fo- 
ram percebidas como um dos quatro fatores que surgem 
das percepções de HBAT. 

Além de afetar a composição da variável estatística, 
multicolinearidade tem um impacto distinto sobre os si- 
nais dos coeficientes estimados. Nesta situação ela se re- 
laciona com a colinearidade entre X,, (Imagem de equipe 
de venda) e X, (Comércio eletrônico). Como observado 
em nossa discussão anterior sobre multicolinearidade, 
um possível efeito é a inversão de sinal para um coefi- 
ciente de regressão estimado a partir da direção esperada 
representada na correlação bivariada. Aqui, a alta corre- 
lação positiva entre X,, e X, (correlação = 0,792) faz com 
que o sinal do coeficiente de regressão de X, mude de po- 
sitivo (na correlação bivariada) para um sinal negativo. 
Se o pesquisador não investigasse a extensão da multico- 
linearidade e seu impacto, poderia ser tirada a conclusão 
inadequada de que aumentos em atividades de comércio 
eletrônico diminuem a satisfação do cliente. 

Logo, o pesquisador deve entender as relações bási- 
cas sustentadas pela teoria conceitual inerente à especi- 
ficação do modelo original e fazer a interpretação com 
base nessa teoria, e não apenas sobre a variável estatís- 
tica estimada. 


O pesquisador jamais deve permitir que um procedi- 
mento de estimação defina a interpretação dos resultados; 
deve, porém, compreender os aspectos de interpretação 
que acompanham cada procedimento de estimação. Por 
exemplo, se todas as 13 variáveis independentes entram 
na variável estatística de regressão, o pesquisador ainda 
deve lidar com os efeitos de colinearidade sobre a inter- 
pretação dos coeficientes, mas de uma maneira diferente 
do que ocorre em stepwise. 
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Estágio 6: Validação dos resultados 


A tarefa final para o pesquisador envolve o processo de 
validação do modelo de regressão. A preocupação funda- 
mental desse processo é garantir que os resultados sejam 
generalizáveis à população e não específicos à amostra usa- 
da na estimação. A abordagem mais direta de validação é 
obter uma outra amostra da população e avaliar a corres- 
pondência dos resultados das duas amostras. Na ausência 
de uma amostra adicional, o pesquisador pode avaliar a 
validade dos resultados de diversas maneiras, incluindo o 
exame do valor R” ajustado ou a estimação do modelo de 
regressão sobre duas ou mais subamostras dos dados. 


O exame do valor Rº ajustado revela pouca perda no po- 
der preditivo quando comparado com o valor R” (0,780 
versus 0,791, ver Tabela 4-14), o que indica uma falta de 
superajuste que apareceria com uma diferença maior en- 
tre os dois valores. Além disso, com cinco variáveis no 
modelo, ele mantém uma proporção adequada de obser- 
vações por variáveis na variável estatística. 

Uma segunda abordagem é dividir a amostra em duas 
subamostras, estimar o modelo de regressão para cada 
subamostra e comparar os resultados. A Tabela 4-17 
contém os modelos estimados stepwise para duas suba- 


mostras de 50 observações cada. A comparação do ajuste 
geral do modelo demonstra um elevado nível de simila- 
ridade dos resultados em termos de R”, Rº ajustado e do 
erro padrão da estimativa. Mas ao se comparar os coefi- 
cientes individuais, algumas diferenças surgem. Na amos- 
tra 1, X, não entrou nos resultados stepwise, mas entrou 
na amostra 2 e na amostra geral. Em seu lugar entrou X,,, 
altamente colinear com X, Além disso, X,, tem um peso 
beta sensivelmente maior na amostra 1 do que nos resul- 
tados gerais. Na segunda amostra, quatro das variáveis 
entraram como no caso dos resultados gerais, mas X,,, 
a variável mais fraca nos resultados gerais, não entrou 
no modelo. A omissão de X, em uma das subamostras 
confirma que este era um preditor atípico, como indicado 
pelos baixos valores beta e tno modelo geral. 


Avaliação de modelos de regressão alternativos 


O modelo de regressão stepwise examinado na discussão 
anterior forneceu uma sólida avaliação do problema de 
pesquisa conforme formulado. No entanto, o pesquisa- 
dor está sempre bem servido na avaliação de modelos de 
regressão alternativos na busca de poder explicativo adi- 
cional e de confirmação de resultados anteriores. Nesta 


TABELA 4-17 Validação com amostra particionada da estimação stepwise 


Ajuste geral do modelo 


Amostra 1 Amostra 2 
R múltiplo 0,910 0,888 
Coeficiente de determinação (R?) 0,828 0,788 
Pº ajustado 0,808 0,769 
Erro padrão da estimativa 0,564 0,529 
Análise de variância 
Amostra 1 Amostra 2 
Soma de Quadrado Soma de Quadrado 
quadrados df médio F Sig. quadrados df médio F Sig. 
Regressão 67,211 5 13,442 42,223 0,000 46,782 4 11,695 41,747 0,000 
Resíduo 14,008 44 0,318 12,607 45 0,280 
Total 81,219 49 59,389 49 
Variáveis incluídas no modelo de regressão stepwise 
AMOSTRA 1 AMOSTRA 2 
Significância Significância 
Coeficientes de regressão estatística Coeficientes de regressão estatística 

Variáveis no modelo B Erro padrão Beta t Sig. B Erro padrão Beta t Sig. 
(Constante) - 1,413 0,736 -1,920 0,061 -0,689 0,686 - 1,005 0,320 
X, Imagem da equipe de venda 1,069 0,151 0,916 7,084 0,000 0,594 0,105 0,568 5,679 0,000 
X, Qualidade do produto 0,343 0,066 0,381 5,232 0,000 0,447 0,062 0,518 7,170 0,000 
X, Comércio eletrônico - 0,728 0,218 -0,416 -3,336 0,002 -0,349 0,165 -0,212 -2,115 0,040 
X, Linha do produto 0,295 0,078 0,306 3,780 0,000 
Xe Encomenda e cobrança 0,285 0,115 0,194 2473 0,017 
X Solução de reclamação 0,421 0,070 0,445 5,996 0,000 
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seção, examinamos dois modelos de regressão adicionais: 
um modelo que inclui as treze variáveis independentes em 
uma abordagem confirmatória, e um segundo modelo que 
acrescenta uma variável não-métrica (X,, Tamanho da fir- 
ma) pelo uso de uma variável dicotômica. 


Modelo confirmatório de regressão 

Uma alternativa básica ao método de estimação de regressão 
stepwise é a abordagem confirmatória, na qual o pesquisador 
especifica a variável independente a ser incluída na equação 
de regressão. Desse modo, o pesquisador detém controle 
completo sobre a variável estatística de regressão em termos 
de previsão e explicação. Esse tratamento é especialmente 
adequado em situações de replicação de esforços anteriores 
de pesquisa ou para fins de validação. 


Nessa situação, a perspectiva confirmatória envolve a 
inclusão das 13 medidas de percepção como variáveis 
independentes. Essas mesmas variáveis são considera- 
das no processo de estimação stepwise, mas nesse caso 
todas entram diretamente na equação de regressão de 
uma só vez. Aqui o pesquisador pode julgar os impactos 
potenciais da multicolinearidade na seleção de variáveis 
independentes e o efeito sobre o ajuste geral do modelo 
a partir da inclusão das sete” variáveis. 


A principal comparação entre os procedimentos stepwise 
e confirmatório envolve o exame do ajuste geral do modelo, 
bem como a interpretação conseguida a partir de cada con- 
junto de resultados. 


Impacto sobre ajuste geral do modelo. Os resultados na 
Tabela 4-18 são semelhantes aos resultados finais alcança- 
dos pela estimação stepwise (ver Tabela 4-14), com duas 
exceções que devem ser destacadas: 


1. Ainda que mais variáveis independentes sejam in- 
cluídas, o ajuste geral do modelo diminui. Ao con- 
trário do coeficiente de determinação que aumenta 
(de 0,889 para 0,897) por causa das variáveis inde- 
pendentes extras, o Rº ajustado diminui levemente 
(de 0,780 para 0,774), o que indica a inclusão de vá- 
rias variáveis independentes que são não-significan- 
tes na equação de regressão. Apesar de contribuírem 
para o valor Rº geral, elas diminuem o Rº ajustado. 
Isso ilustra o papel do Rº ajustado na comparação de 
variáveis estatísticas de regressão com diferentes nú- 
meros de variáveis independentes. 

2. Uma outra indicação do ajuste geral mais pobre do 
modelo confirmatório é o aumento no erro padrão da 
estimativa (SEE) de 0,559 para 0,566, o que demons- 
tra que o R” geral não deve ser o único critério para 
a precisão preditiva, pois pode ser influenciado por 
muitos fatores, entre os quais o número de variáveis 
independentes. 


*N. de R. T.: A frase correta seria “a partir da inclusão das 13 va- 
riáveis”. 


Impacto sobre interpretação da variável estatística. A 
outra diferença está na variável estatística de regressão, 
onde a multicolinearidade afeta o número e a força das 
variáveis significantes. 


1. Primeiro, apenas três variáveis (X,, X, e X,,) são 
estatisticamente significantes, ao passo que o mo- 
delo stepwise contém duas variáveis a mais (X, e 
X,,). No modelo stepwise, X, era a variável menos 
significante, com um nível de significância de 0,005. 
Quando a abordagem confirmatória é empregada, a 
multicolinearidade com outras variáveis (como in- 
dicado por seu valor de tolerância de 0,026) a reduz 
a não-significante. O mesmo acontece com X,, que 
foi a primeira variável a entrar na solução stepwise, 
mas que agora tem um coeficiente não-significante 
no modelo confirmatório. Novamente, multicoline- 
aridade teve um impacto perceptível, refletido em 
seu valor de tolerância de 0,207. 

2. O impacto de multicolinearidade sobre outras va- 
riáveis não presentes no modelo stepwise também é 
substancial. Na abordagem confirmatória, três variá- 
veis (X,,, X, e X,) têm valores de tolerância abaixo 
de 0,05 (com valores VIF correspondentes de 33,3, 
37,9 e 44,0)**, o que significa que 95% ou mais de sua 
variância é explicada pelas outras percepções HBAT. 
Em tais situações, é praticamente impossível para es- 
sas variáveis serem preditoras significantes. Seis ou- 
tras têm valores de tolerância abaixo de 0,50, indican- 
do que as variáveis do modelo de regressão explicam 
mais da metade da variância das mesmas. 


Assim, enquanto a multicolinearidade foi responsável 
pela criação de quatro fatores bem desenvolvidos no Capí- 
tulo 3, aqui a inclusão de todas as variáveis cria problemas 
na estimação e na interpretação. 

A abordagem confirmatória fornece ao pesquisador 
controle sobre a variável estatística de regressão, mas ao 
custo possível de uma equação de regressão com previsão 
e explicação mais pobres se o pesquisador não examinar 
atentamente os resultados. As abordagens confirmatória e 
sequencial têm vantagens e desvantagens que devem ser 
consideradas em seu uso, mas o pesquisador prudente em- 
prega ambas, a fim de lidar com as vantagens de cada uma. 


Inclusão de uma variável independente não-métrica 
A discussão anterior se concentrou no método de estima- 
ção confirmatória como uma alternativa para talvez au- 
mentar a previsão e a explicação, mas o pesquisador tam- 
bém deve considerar o possível melhoramento a partir da 
adição de variáveis independentes não-métricas. Como 
discutido em uma seção anterior e no Capítulo 2, as variá- 
veis não-métricas não podem ser diretamente incluídas na 


** N. de R. T.: A ordem correta dos números é 37,9, 33,3 e 44,0. 
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TABELA 4-18 Resultados de regressão múltipla usando uma abordagem de estimação confirmatória com todas as 13 variáveis 


independentes 


Especificação confirmatória com 13 variáveis 


R múltiplo 0,897 
Coeficiente de determinação (R?) 0,804 
Rº ajustado 0,774 
Erro padrão da estimativa 0,566 


Análise de variância 


Soma de 


quadrados df Quadrado médio 


F Sig. 


Regressão 113,044 13 8,696 
Resíduo 27,584 86 0,321 
Total 140,628 99 


27,411 0,000 


Variáveis presentes no modelo de regressão 


Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 

Variáveis no modelo B padrão Beta t Sig. zero Parciais parciais Tolerância VIF 
(Constante) -1,336 1,120 -1,192 0,236 
X, Qualidade do produto 0,377 0,053 0,442 7,161 0,000 0,486 0,611 0,342 0,598 1,672 
X, Comércio eletrônico -0,456 0,137 -0,268 -3,341 0,001 0,283 -0,339  -0,160 0,354 2,823 
X; Suporte técnico 0,035 0,065 0,045 0,542 0,589 0,113 0,058 0,026 0,328 3,047 
X Solução de reclamação 0,154 0,104 0,156 1,489 0,140 0,603 0,159 0,071 0,207 4,838 
X,o Anúncio -0,034 0,063 -0,033 -0,548 0,585 0,305 -0,059  -0,026 0,646 1,547 
X, Linha do produto 0,362 0,267 0,400 1,359 0,178 0,551 0,145 0,065 0,026 37,978 
X,> Imagem da equipe de venda 0,827 0,101 0,744 8,155 0,000 0,500 0,660 0,389 0,274 3,654 
X,s Preço competitivo -0,047 0,048 0,062 -0,985 0,328 -0,208 -0,106 0,047 0,584 1,712 
X,, Garantia e reclamações -0,107 0,126 0,074 -0,852 0,397 0,178 -0,092 0,041 0,306 3,268 
X,5 Novos produtos -0,003 0,040 -0,004 -0,074 0,941 0,071 -0,008  -0,004 0,930 1,075 
X,, Encomenda e cobrança 0,143 0,105 0,111 1,369 0,175 0,522 0,146 0,065 0,344 2,909 
X, Flexibilidade de preço 0,238 0,272 0,241 0,873 0,385 0,056 0,094 0,042 0,030 33,332 
X, Velocidade de entrega -0,249 0,514  -0,154 -0,485 0,629 0,577 -0,052  -0,023 0,023 44,004 


equação de regressão, mas devem ser representadas por 
uma série de novas variáveis criadas, chamadas de dico- 
tômicas, as quais representam as categorias separadas da 
variável não-métrica. 


Neste exemplo, a variável de tamanho da empresa (X,), 
que tem as duas categorias (firmas pequenas e gran- 
des), será acrescentada ao processo de estimação ste- 
pwise. A variável já está codificada na forma apropria- 
da, sendo que as grandes empresas (500 empregados 
ou mais) são codificadas como 1 e as pequenas, como 
0. A variável pode ser diretamente incluída na equação 
de regressão para representar a diferença na satisfação 
de clientes entre grandes e pequenas empresas, dadas 
as outras variáveis na equação de regressão. Especifi- 
camente, como as grandes empresas têm o valor 1, as 
pequenas atuam como a categoria de referência. 

O coeficiente de regressão é interpretado como o 
valor para grandes empresas comparado com as pe- 


quenas. Um coeficiente positivo indica que as grandes 
têm uma maior satisfação de clientes do que as peque- 
nas, enquanto um valor negativo indica que as peque- 
nas têm maior satisfação de clientes. A magnitude do 
coeficiente representa a diferença em satisfação de 
clientes entre as médias dos dois grupos, controlando 
todas as demais variáveis no modelo. 

A Tabela 4-19 contém os resultados da adição de X, 
em um modelo stepwise, onde ela foi adicionada às cin- 
co variáveis que formavam o modelo stepwise anterior 
desta seção (ver Tabela 4-14). O exame das estatísticas 
gerais de ajuste indica uma melhora mínima, em que 
todas as medidas (R”, Rº ajustado e SEE) aumentam 
em relação ao modelo stepwise (ver Tabela 4-14). Isso 
é apoiado pela significância estatística do coeficiente 
de regressão para X, (significância de 0,030). O valor 
positivo do coeficiente (0,271) indica que as empresas 
grandes, dadas as suas características nas outras cinco 


(Continua) 


CAPÍTULO 4 Análise de Regressão Múltipla 217 


TABELA 4-19 Resultados de regressão múltipla adicionando X, (Tamanho de firma) como variável independente usando-se uma variável 


dicotômica 


Regressão stepwise com variáveis transformadas 


R múltiplo 0,895 
Coeficiente de determinação (R?) 0,801 
FÊ ajustado 0,788 
Erro padrão da estimativa 0,548 


Análise de variância 


Soma de 
quadrados df Quadrado médio 


F Sig. 


Regressão 112,669 6 18,778 
Resíduo 27,958 93 0,301 
Total 140,628 99 


62,464 0,000 


Variáveis presentes no modelo de regressão 


Significância Estatísticas de 
Coeficientes de regressão estatística Correlações colinearidade 
Erro Ordem Semi- 

Variáveis no modelo B padrão Beta t Sig. zero Parciais parciais Tolerância VIF 
(Constante) -1,250 0,492 -2,542 0,013 
X Solução de reclamação 0,300 0,060 0,304 4,994 0,000 0,603 0,460 0,231 0,576 1,736 
X Qualidade do produto 0,365 0,046 0,427 7,881 | 0,000 0,486 0,633 0,364 0,727 1,375 
X, Imagem da equipe de venda 0,701 0,093 0,631 7,507 0,000 0,500 0,614 0,347 0,303 3,304 
X, Comércio eletrônico -0,333 0,135 -0,196 -2473 0,015 0,283 -0,248  -0,114 0,341 2,935 
X,, Linha do produto 0,203 0,061 0,224 3,323 0,001 0,551 0,326 0,154 0,469 2,130 
X; Tamanho da firma 0,271 0,123 0,114 2,207 0,030 0,229 0,223 0,102 0,798 1,253 


(Continuação) 
variáveis independentes na equação, ainda têm uma 
satisfação de clientes que é em torno de um quarto de 
ponto maior (0,271) na questão de 10 pontos. O uso de 
X, aumentou a previsão só um pouco. Sob um ponto de 
vista explanatório, porém, sabemos que grandes em- 
presas contam com maior satisfação de clientes. 


Este exemplo ilustra a maneira na qual o pesquisador 
pode acrescentar variáveis não-métricas às variáveis mé- 
tricas na variável estatística de regressão e melhorar tanto 
a previsão quanto a explicação. 


Uma visão gerencial dos resultados 


Os resultados da regressão, incluindo a avaliação comple- 
mentar do modelo confirmatório e a adição da variável 
não-métrica, auxiliam na solução da questão básica de 
pesquisa: o que afeta a satisfação do cliente? Ao formular 
uma resposta, o pesquisador deve considerar dois aspec- 
tos: previsão e explicação. 


Em termos de previsão, os modelos de regressão sempre 
atingem níveis elevados de precisão preditiva. A quantia de 
variância explicada gira em torno de 80%, e a taxa de erro 
esperado para qualquer previsão no intervalo de confiança 


de 95% é de aproximadamente 1,1 pontos. Nesse tipo de 
contexto de pesquisa, tais níveis, aumentados pelos resulta- 
dos que suportam a validade do modelo, fornecem os mais 
altos níveis de garantia quanto à qualidade e precisão dos 
modelos de regressão como a base para desenvolver estra- 
tégias de negócios. 

Em termos de explicação, todos os modelos estima- 
dos chegaram essencialmente aos mesmos resultados: três 
influências fortes (X,,, Imagem da equipe de venda; X,, 
Qualidade do produto; e X,, Solução de reclamação). Au- 
mentos em qualquer uma dessas variáveis resultarão em 
aumentos na satisfação do cliente. Por exemplo, um au- 
mento de um ponto na percepção do cliente da Imagem da 
equipe de venda (X,,) resultará em um aumento médio de 
pelo menos sete décimos (0,701) de um ponto na escala de 
10 pontos de satisfação de cliente. Resultados semelhantes 
são percebidos para as outras duas variáveis. Além disso, 
pelo menos uma característica da empresa, tamanho, de- 
monstrou um efeito significante sobre satisfação do cliente. 
Empresas maiores têm níveis de satisfação em torno de um 
quarto de ponto (0,271) maiores do que empresas meno- 
res. Esses resultados dão ao gerenciamento uma estrutura 
para desenvolver estratégias para melhorar a satisfação do 
cliente. Ações dirigidas para aumentar as percepções sobre 
a HBAT podem ser justificadas à luz dos aumentos corres- 


pondentes de satisfação de cliente. 
(Continua) 
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(Continuação) 

O impacto de duas outras variáveis (X,, Comércio ele- 
trônico; X,, Linha do produto) sobre a satisfação do clien- 
te é menos certo. Mesmo que essas duas variáveis fossem 
incluídas na solução stepwise, sua variância explicada com- 
binada seria de apenas 0,038 fora de um Rº geral do mode- 
lo de 0,791. Ambas as variáveis eram não-significantes no 
modelo confirmatório. Além disso, X, tinha o sinal inver- 
tido no modelo stepwise, o que, apesar de se dever à multi- 
colinearidade, ainda representa um resultado contrário ao 
desenvolvimento de uma estratégia gerencial. Como resul- 
tado, o pesquisador deve considerar a redução da influên- 
cia alocada a essas variáveis e talvez até mesmo omiti-las 
da consideração como influências na satisfação do cliente. 

Ao desenvolver conclusões ou planos estratégicos a 
partir desses resultados, o pesquisador deve observar tam- 
bém que as três maiores influências (X,,, X, e X,) são com- 
ponentes fundamentais das dimensões perceptuais identi- 
ficadas na análise fatorial do Capítulo 3. Essas dimensões, 
que representam amplas medidas de percepções da HBAT, 
devem assim ser consideradas em qualquer conclusão. Es- 
tabelecer que apenas essas três variáveis específicas são 
influências sobre a satisfação do cliente seria uma séria in- 
compreensão dos padrões mais complexos de colinearida- 
de entre variáveis. Assim, essas variáveis são melhor vistas 
como representativas das dimensões perceptuais, com as 
outras variáveis em cada dimensão também sendo conside- 
radas nas conclusões extraídas desses resultados. 

A gerência agora tem uma análise objetiva que con- 
firma não somente as influências específicas de variáveis- 
chave, mas também as dimensões perceptuais que devem 
ser consideradas em qualquer forma de planejamento de 
negócios que envolva estratégias que visem um impacto 
sobre a satisfação do cliente. 


Resumo 


Este capítulo apresenta uma visão geral dos conceitos 
fundamentais inerentes à análise de regressão múltipla. A 
análise de regressão múltipla pode descrever as relações 
entre duas ou mais variáveis com escalas intervalares e é 
muito mais poderosa do que a regressão simples com uma 
única variável independente. Este capítulo ajuda você a 
fazer o seguinte: 


Determinar quando a análise de regressão é a ferramen- 
ta estatística apropriada para analisar um problema. A 
análise de regressão múltipla pode ser usada para anali- 
sar a relação entre uma variável dependente (critério) e 
diversas variáveis independentes (preditores). O objetivo 
da análise de regressão múltipla é usar as diversas variá- 
veis independentes cujos valores são conhecidos para pre- 
ver a dependente. Regressão múltipla é uma técnica de 
dependência. Para usá-la você deve ser capaz de dividir 
as variáveis em dependente e independentes, sendo que 
todas devem ser métricas. Sob certas circunstâncias, é 
possível incluir dados não-métricos tanto como variáveis 


independentes (transformando dados ordinais ou nomi- 
nais com uma codificação dicotômica) como a dependente 
(pelo uso de uma medida binária na técnica especializada 
de regressão logística). Assim, para se aplicar análise de 
regressão múltipla: (1) os dados devem ser métricos ou 
apropriadamente transformados, e, (2) antes de obter a 
equação de regressão, o pesquisador deve decidir qual va- 
riável será a dependente e quais serão as independentes. 


Compreender como a regressão nos ajuda a fazer previ- 
sões usando o conceito de mínimos quadrados. O obje- 
tivo da análise de regressão é prever uma única variável 
dependente a partir do conhecimento de uma ou mais 
variáveis independentes. Antes de estimar a equação de 
regressão, devemos calcular a base de referência com a 
qual compararemos a habilidade preditiva de nossos mo- 
delos de regressão. A base deve representar nossa melhor 
previsão sem o emprego de variáveis independentes. Em 
regressão, o preditor base é a média simples da variável 
dependente. Como a média não prevê perfeitamente cada 
valor da variável dependente, devemos ter uma maneira 
de avaliar precisão preditiva que possa ser utilizada com 
a previsão base e com os modelos de regressão que cria- 
mos. A maneira usual de avaliar a precisão de qualquer 
previsão é examinar os erros na previsão da variável de- 
pendente. Ainda que possamos esperar obter uma medida 
útil de precisão preditiva simplesmente somando os erros, 
essa abordagem não é possível simplesmente porque os 
erros em relação à média sempre somam zero. Para su- 
perar este problema, elevamos ao quadrado cada erro e 
somamos os resultados. Este total, chamado de soma dos 
erros quadrados (SS,), fornece uma medida de precisão 
preditiva que irá variar de acordo com a quantia de erros 
de previsão. A meta é obter a menor soma possível de er- 
ros quadrados como nossa medida de precisão preditiva. 
Logo, o conceito de mínimos quadrados nos permite atin- 
gir a melhor precisão possível. 


Usar variáveis dicotômicas com uma compreensão de sua 
interpretação. Uma situação comum encarada pelos 
pesquisadores é o desejo de utilizar variáveis independen- 
tes não-métricas. Muitas técnicas multivariadas assumem 
medidas métricas para variáveis independentes e depen- 
dentes. Quando a variável dependente é medida como di- 
cotômica (0, 1), ou a análise discriminante, ou uma forma 
especializada de regressão (regressão logística), ambas 
discutidas no Capítulo 5, é adequada. Quando as variáveis 
independentes são não-métricas e têm duas ou mais ca- 
tegorias, podemos criar variáveis dicotômicas que atuam 
como variáveis independentes de substituição. Cada va- 
riável dicotômica representa uma categoria de uma variá- 
vel independente não-métrica, e qualquer variável não- 
métrica com k categorias pode ser representada como 
k — 1 variáveis dicotômicas. Assim, variáveis não-métricas 
podem ser convertidas para um formato métrico para uso 
na maioria das técnicas multivariadas. 
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Estar ciente das suposições inerentes à análise de regres- 
são e de como avaliá-las. Melhoramentos na previsão 
da variável dependente são viáveis acrescentando-se va- 
riáveis independentes e mesmo transformando-as para 
representar relações não-lineares. Para isso, devemos fa- 
zer várias suposições sobre as relações entre a variável de- 
pendente e as independentes que afetam o procedimento 
estatístico (mínimos quadrados) usado para regressão 
múltipla. A questão básica é saber, no curso do cálculo 
dos coeficientes de regressão e previsão da variável de- 
pendente, se as suposições da análise de regressão foram 
atendidas. Devemos saber se os erros de previsão são re- 
sultado da ausência de uma relação entre as variáveis ou 
se são provocados por algumas características dos dados 
que não estão acomodadas pelo modelo de regressão. 
As suposições a serem examinadas incluem linearidade 
do fenômeno medido, variância constante dos termos de 
erro, independência dos termos de erro, e normalidade 
da distribuição dos mesmos. As suposições inerentes à 
análise de regressão múltipla se aplicam tanto às variá- 
veis individuais (dependente e independentes) quanto à 
relação como um todo. Uma vez que a variável estatística 
tenha sido obtida, ela atua coletivamente na previsão da 
variável dependente, necessitando-se de uma avaliação 
das suposições não apenas para as variáveis individuais, 
mas também para a variável estatística. A principal medi- 
da de erro de previsão para a variável estatística é o resí- 
duo — a diferença entre os valores observados e previstos 
para a variável dependente. Fazer o gráfico dos resíduos 
versus variáveis independentes ou previstas é um método 
básico para identificar violações de suposição para a re- 
lação geral. 


Selecionar uma técnica de estimação e explicar a dife- 
rença entre stepwise e regressão simultânea. Em re- 
gressão múltipla, um pesquisador pode escolher diver- 
sas variáveis independentes possíveis para inclusão na 
equação de regressão. Às vezes, o conjunto de variáveis 
independentes é exatamente especificado e o modelo de 
regressão é essencialmente utilizado como uma técnica 
confirmatória. Essa abordagem, chamada de regressão 
simultânea, inclui todas as variáveis ao mesmo tempo. 
Em outros casos, o pesquisador pode usar a técnica esti- 
mativa do “pegue e escolha” dentro do conjunto de va- 
riáveis independentes com métodos de busca segiiencial 
ou processos combinatórios. O método de busca segiien- 
cial mais popular é a estimação stepwise, que permite ao 
pesquisador examinar a contribuição de cada variável 
independente ao modelo de regressão. A abordagem 
combinatória é um processo de busca generalizada en- 
tre todas as possíveis combinações de variáveis indepen- 
dentes. O procedimento mais conhecido é a regressão 
de todos-os-possíveis-subconjuntos, que é exatamente o 
que o nome sugere. Todas as possíveis combinações das 
variáveis independentes são examinadas, e o conjunto 
de variáveis melhor ajustado é identificado. Cada técnica 


de estimação é planejada para auxiliar o pesquisador na 
busca do melhor modelo de regressão usando diferentes 
abordagens. 


Interpretar os resultados de regressão. A variável esta- 
tística de regressão deve ser interpretada avaliando-se os 
coeficientes de regressão estimados quanto à sua explica- 
ção da variável dependente. O pesquisador deve avaliar 
não somente o modelo de regressão que foi estimado, mas 
também as potenciais variáveis independentes que foram 
omitidas no caso de uma busca sequencial ou uma técnica 
combinatória ter sido empregada. Nessas abordagens, mul- 
ticolinearidade pode afetar substancialmente as variáveis 
incluídas na variável estatística de regressão. Logo, além 
de avaliar os coeficientes estimados, o pesquisador tam- 
bém deve olhar o impacto potencial de variáveis omitidas 
para garantir que a significância gerencial seja examinada 
juntamente com a significância estatística. Os coeficientes 
de regressão estimados, ou coeficientes beta, represen- 
tam o tipo de relação (positiva ou negativa) e a força da 
relação entre variáveis independentes e dependente na 
variável estatística de regressão. O sinal do coeficiente de- 
nota se a relação é positiva ou negativa, enquanto o valor 
do mesmo mostra a variação no valor dependente cada 
vez que a variável independente varia em uma unidade. 
Previsão é um elemento integral na análise de regressão, 
tanto no processo de estimação quanto em situações suge- 
ridas pelo próprio nome. Regressão envolve o uso de uma 
variável estatística para estimar um só valor para a variá- 
vel dependente. Este processo é usado não somente para 
calcular os valores previstos no procedimento de estima- 
ção, mas também com amostras adicionais para validação 
ou para fins de previsão. Frequentemente o pesquisador 
está interessado não apenas em previsão, mas também em 
explicação. Variáveis independentes com coeficientes de 
regressão maiores têm uma contribuição maior para o va- 
lor previsto. Consegue-se uma visão sobre a relação entre 
variáveis independentes e dependente ao se examinarem 
as contribuições relativas de cada variável independente. 
Logo, para fins de explicação, os coeficientes de regressão 
se tornam indicadores do impacto relativo e da importân- 
cia das variáveis independentes em suas relações com a 
dependente. 


Aplicar os procedimentos diagnósticos necessários para 
avaliar observações influentes. Observações influentes 
incluem todas aquelas que têm efeito desproporcional so- 
bre os resultados de regressão. Os três tipos básicos são 
os seguintes: 


1. Observações atípicas. Observações que têm grandes valores 
residuais e podem ser identificadas somente em relação a 
um modelo específico de regressão. 

2. Pontos de alavancagem. Observações que são distintas das 
demais com base nos valores das variáveis independentes. 

3. Observações influentes. Todas aquelas que têm um efeito 
desproporcional sobre os resultados de regressão. 
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Observações influentes, atípicas e pontos de alavanca- 
gem são baseadas em uma entre quatro condições: 


1. Um erro de observações ou de entrada de dados: Remedie 
corrigindo os dados ou eliminando o caso. 

2. Uma observação válida mas excepcional que é explicável por 
uma situação extraordinária: Remedie eliminando o caso, a 
menos que variáveis refletindo a situação extraordinária se- 
jam incluídas na equação de regressão. 

3. Uma observação excepcional aparentemente sem explicação: 
Apresenta um problema especial, pois o pesquisador não 
tem motivo para eliminar o caso, mas sua inclusão não pode 
ser justificada, o que sugere análises com e sem as observa- 
ções para fins de uma avaliação completa. 

4. Uma observação comum em suas características individuais 
mas excepcional em sua combinação de características: In- 
dica modificações na base conceitual do modelo e deve ser 
mantida. 


O pesquisador deve eliminar observações verdadei- 
ramente excepcionais mas evitar descartar aquelas que, 
apesar de diferentes, são representativas da população. 

Este capítulo fornece uma apresentação fundamental 
sobre como funciona a regressão e o que ela pode alcan- 
çar. A familiaridade com os conceitos apresentados dá 
uma fundamentação para a análise de regressão que o 
pesquisador deve utilizar, e ajuda a entender melhor os 
tópicos mais complexos e técnicos de outros livros sobre 
esse assunto. 


Questões 


1. Como você explica a importância relativa das variáveis in- 
dependentes usadas em uma equação de regressão? 

2. Por que é importante examinar a suposição de linearidade 
quando se usa regressão? 

3. Como a não-linearidade pode ser corrigida ou explicada na 
equação de regressão? 

4. Você consegue encontrar uma equação de regressão que 
seja aceitável como estatisticamente significante, mas que 
não ofereça valor interpretativo aceitável para fins de admi- 
nistração? 

5. Qual é a diferença de interpretação entre os coeficientes de 
regressão associados com variáveis independentes métricas 
e aqueles associados com variáveis codificadas como dicotô- 
micas (0, 1)? 

6. Quais são as diferenças entre variáveis independentes inte- 
rativas e correlacionadas? Algumas dessas diferenças afe- 
tam sua interpretação da equação de regressão? 

7. Os casos influentes devem sempre ser omitidos? Dê exem- 
plos de ocasiões em que eles devem ou não devem ser omi- 
tidos. 


Leituras sugeridas 


Uma lista de leituras sugeridas ilustrando problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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CAPÍTULO 


Análise Discriminante Múltipla 
e Regressão Logística 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


= Estabelecer as circunstâncias sob as quais a análise discriminante linear ou a regressão 
logística deve ser usada no lugar de uma regressão múltipla. 

m Identificar as questões mais importantes relativas aos tipos de variáveis usadas e ao tamanho 
de amostra exigido na aplicação de análise discriminante. 

m (Compreender as suposições inerentes à análise discriminante para avaliar a adequação de 
seu uso em um problema em particular. 

m Descrever as duas abordagens computacionais para a análise discriminante e o método para 
avaliar o ajuste geral do modelo. 

= Explicar o que é uma matriz de classificação e como desenvolver uma, e descrever as 
maneiras de avaliar a precisão preditiva da função discriminante. 
Dizer como identificar variáveis independentes com poder discriminatório. 

m Justificar o uso de uma abordagem de partição de amostras para validação. 
Compreender as vantagens e desvantagens da regressão logística comparada com a análise 
discriminante e a regressão múltipla. 

m Interpretar os resultados de uma análise de regressão logística, comparando-os com a 
regressão múltipla e a análise discriminante. 


Apresentação do capítulo 


A regressão múltipla é sem dúvida a técnica de dependência multivariada mais amplamente empre- 
gada. A base para a popularidade da regressão tem sido sua habilidade de prever e explicar variáveis 
métricas. Mas o que acontece quando variáveis não-métricas tornam a regressão múltipla inadequada? 
Este capítulo introduz duas técnicas — análise discriminante e regressão logística — que tratam da situa- 
ção de uma variável dependente não-métrica. Neste tipo de situação, o pesquisador está interessado 
na previsão e na explicação das relações que afetam a categoria na qual um objeto está localizado, 
como a questão do por quê uma pessoa é um cliente ou não, ou se uma empresa terá sucesso ou fra- 
cassará. Os dois maiores objetivos deste capítulo são: 


1. Introduzir a natureza, a filosofia e as condições da análise discriminante múltipla e da regressão logiís- 
tica 
2. Demonstrar a aplicação e interpretação dessas técnicas com um exemplo ilustrativo 
O Capítulo 1 estabeleceu que o propósito básico da análise discriminante é estimar a relação entre 
uma variável dependente não-métrica (categórica) e um conjunto de variáveis independentes métricas, 
nesta forma geral: 


Y =XEMAXMAC AX, 


(não-métrica) (métricas) 
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A análise discriminante múltipla e a regressão logística encontram amplas aplicações em situações 
nas quais o objetivo principal é identificar o grupo ao qual um objeto (p.ex., uma pessoa, uma firma 
ou um produto) pertence. Aplicações potenciais incluem prever o sucesso ou fracasso de um novo 
produto, decidir se um estudante deve ser aceito em uma faculdade, classificar estudantes quanto a 
interesses vocacionais, determinar a categoria de risco de crédito de uma pessoa, ou prever se uma 
empresa terá sucesso. Em cada caso, os objetos recaem em grupos, e o objetivo é prever ou explicar 
as bases para a pertinência de cada objeto a um grupo através de um conjunto de variáveis indepen- 


dentes selecionadas pelo pesquisador 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 
pontos que merecem destaque, além das referências cruza- 
das nos termos-chave, estão em itálico. Exemplos ilustrativos 
estão em quadros. 


Amostra de análise Grupo de casos usado para estimar a(s) 
função(ões) discriminante(s) ou o modelo de regressão logis- 
tica. Quando se constroem matrizes de classificação, a amos- 
tra original é dividida aleatoriamente em dois grupos, um para 
estimação do modelo (a amostra de análise) e o outro para 
validação (a amostra de teste). 

Abordagem de extremos polares Método para construir uma 
variável dependente categórica a partir de uma variável métri- 
ca. Primeiro, a variável métrica é dividida em três categorias. 
Em seguida, as categorias extremas são usadas na análise 
discriminante ou na regressão logística, e a categoria do meio 
não é incluída na análise. 

Amostra de teste Grupo de objetos não usados para computar 
a(s) função(ões) discriminante(s) ou o modelo de regressão 
logística. Esse grupo é então usado para validar a função 
discriminante ou o modelo de regressão logística em uma 
amostra separada de respondentes. É também chamada de 
amostra de validação. 

Amostra de validação Ver amostra de teste. 

Análise logit Ver regressão logística. 

Cargas discriminantes Medida da correlação linear simples 
entre cada variável independente e o escore Z discriminante 
para cada função discriminante; também chamadas de corre- 
lações estruturais. As cargas discriminantes são calculadas 
sendo incluída uma variável independente na função discri- 
minante ou não. 

Centróide Valor médio para os escores Z discriminantes de to- 
dos os objetos, em uma dada categoria ou grupo. Por exem- 
plo, uma análise discriminante de dois grupos tem dois cen- 
tróides, um para os objetos em cada grupo. 

Coeficiente discriminante Ver peso discriminante. 

Coeficiente logístico exponenciado Anti-logaritmo do coefi- 
ciente logístico, usado para fins de interpretação na regres- 
são logística. O coeficiente exponenciado menos 1,0 é igual 
à mudança percentual nas desigualdades. Por exemplo, um 
coeficiente exponenciado de 0,20 representa uma mudança 
negativa de 80% na desigualdade (0,20 — 1,0 = — 0,80) para 
cada unidade de variação na variável independente (o mes- 
mo se a desigualdade fosse multiplicada por 0,20). Assim, um 


valor de 1,0 se iguala a nenhuma mudança na desigualdade, 
e valores acima de 1,0 representam aumentos na desigualda- 
de prevista. 

Coeficiente logístico Coeficiente no modelo de regressão lo- 
gística que atua como o fator de ponderação para as variá- 
veis independentes em relação a seu poder discriminatório. 
Semelhante a um peso de regressão ou um coeficiente dis- 
criminante. 

Correlações estruturais Ver cargas discriminantes. 

Critério das chances proporcionais Outro critério para avaliar 
a razão de sucesso, no qual a probabilidade média de clas- 
sificação é calculada considerando-se todos os tamanhos de 
grupos. 

Critério de chance máxima Medida de precisão preditiva na 
matriz de classificação que é calculada como o percentual de 
respondentes no maior grupo. A idéia é que a melhor escolha 
desinformada é classificar cada observação no maior grupo. 

Curva logística Uma curva em S formada pela transformação 
logit que representa a probabilidade de um evento. A forma 
em S é não-linear porque a probabilidade de um evento deve 
se aproximar de O e 1, porém jamais sair destes limites. As- 
sim, apesar de haver uma componente linear no meio do in- 
tervalo, à medida que as probabilidades se aproximam dos 
limites inferior e superior de probabilidade (O e 1), elas devem 
se amenizar e ficar assintóticas nesses limites. 

Escore de corte ótimo Valor de escore Z discriminante que me- 
lhor separa os grupos em cada função discriminante para fins 
de classificação. 

Escore de corte Critério segundo o qual cada escore Z discri- 
minante individual é comparado para determinar a pertinência 
prevista em um grupo. Quando a análise envolve dois grupos, 
a previsão de grupo é determinada computando-se um úni- 
co escore de corte. Elementos com escores Z discriminantes 
abaixo dessa marca são designados a um grupo, enquanto 
aqueles com escores acima são classificados no outro. Para 
três ou mais grupos, funções discriminantes múltiplas são 
usadas, com um escore de corte diferente para cada função. 

Escore Z Ver escore Z discriminante. 

Escore Z discriminante Escore definido pela função discri- 
minante para cada objeto na análise e geralmente dado em 
termos padronizados. Também conhecido como escore Z, é 
calculado para cada objeto em cada função discriminante e 
usado em conjunção com o escore de corte para determinar 
pertinência prevista ao grupo. É diferente da terminologia es- 
core z usada para variáveis padronizadas. 

Estatística Q de Press Medida do poder classificatório da 
função discriminante quando comparada com os resultados 
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esperados de um modelo de chances. O valor calculado é 
comparado com um valor crítico baseado na distribuição qui- 
quadrado. Se o valor calculado exceder o valor crítico, os re- 
sultados da classificação serão significantemente melhores 
do que se esperaria do acaso. 

Estatística Wald Teste usado em regressão logística para a sig- 
nificância do coeficiente logístico. Sua interpretação é seme- 
lhante aos valores F ou tusados para o teste de significância 
de coeficientes de regressão. 

Estimação simultânea Estimação da(s) função(ões) discrimi- 
nante(s) ou do modelo de regressão logística em um único 
passo, onde pesos para todas as variáveis independentes 
são calculados simultaneamente; contrasta com a estimação 
stepwise, na qual as variáveis independentes entram seguen- 
cialmente de acordo com o poder discriminante. 

Estimação stepwise Processo de estimação de função(ões) 
discriminante(s) ou do modelo de regressão logística no qual 
variáveis independentes entram sequencialmente de acordo 
com o poder discriminatório que elas acrescentam à previsão 
de pertinência no grupo. 

Expansão dos vetores Vetor escalonado no qual o vetor origi- 
nal é modificado para representar a razão F correspondente. 
Usado para representar graficamente as cargas da função 
discriminante de uma maneira combinada com os centróides 
de grupo. 

Função de classificação Método de classificação no qual uma 
função linear é definida para cada grupo. A classificação é 
realizada calculando-se um escore para cada observação na 
função de classificação de cada grupo e então designando- 
se a observação ao grupo com o maior escore. É diferente do 
cálculo do escore Z discriminante, que é calculado para cada 
função discriminante. 

Função discriminante linear de Fisher Ver função de classifi- 
cação. 

Função discriminante Uma variável estatística das variáveis 
independentes selecionadas por seu poder discriminatório 
usado na previsão de pertinência ao grupo. O valor previsto 
da função discriminante é o escore Z discriminante, o qual é 
calculado para cada objeto (pessoa, empresa ou produto) na 
análise. Ele toma a forma da equação linear 


Zu at Wit WMM + WXy 

k = escore Z discriminante da função discriminante j para 
o objeto k 

a = intercepto 

W, = peso discriminante para a variável independente / 

Xy = variável independente i para o objeto k 


Índice potência Medida composta do poder discriminatório de 
uma variável independente quando mais de uma função dis- 
criminante é estimada. Baseada em cargas discriminantes, é 
uma medida relativa usada para comparar a discriminação 
geral dada por conta de cada variável independente em to- 
das as funções discriminantes significantes. 

M de Box Teste estatístico para a igualdade das matrizes de co- 
variância das variáveis independentes nos grupos da variável 
dependente. Se a significância estatística não exceder o nível 


crítico (i.e., não-significância), então a igualdade das matrizes 
de covariância encontra sustentação. Se o teste mostra signi- 
ficância estatística, os grupos são considerados diferentes e 
a suposição é violada. 

Mapa territorial Representação gráfica dos escores de corte 
em um gráfico de duas dimensões. Quando é combinado com 
os gráficos de casos individuais, a dispersão de cada grupo 
pode ser vista e as classificações ruins de casos individuais 
podem ser diretamente identificadas a partir do mapa. 

Matriz de classificação Meio de avaliar a habilidade preditiva 
da(s) função(ões) discriminante(s) ou da regressão logística 
(também chamada de matriz confusão, designação ou de 
previsão). Criada pela tabulação cruzada dos membros do 
grupo real com os do grupo previsto, essa matriz consiste em 
números na diagonal, que representam classificações corre- 
tas, e números fora da diagonal, que representam classifica- 
ções incorretas. 

Percentual corretamente classificado Ver razão de sucesso. 

Peso discriminante Peso cujo tamanho se relaciona ao poder 
discriminatório daquela variável independente ao longo dos 
grupos da variável dependente. Variáveis independentes com 
grande poder discriminatório geralmente têm pesos grandes, 
e as que apresentam pouco poder discriminatório geralmente 
têm pesos pequenos. No entanto, a multicolinearidade entre 
as variáveis independentes provoca exceções a essa regra. É 
também chamado de coeficiente discriminante. 

Pseudo R? Um valor de ajuste geral do modelo que pode ser 
calculado para regressão logística; comparável com a medi- 
da Rº usada em regressão múltipla. 

Razão de desigualdade A comparação da probabilidade de 
um evento acontecer com a probabilidade de o evento não 
acontecer, a qual é usada como uma medida da variável de- 
pendente em regressão logística. 

Razão de sucesso Percentual de objetos (indivíduos, respon- 
dentes, empresas etc.) corretamente classificados pela fun- 
ção discriminante. É calculada como o número de objetos na 
diagonal da matriz de classificação dividido pelo número total 
de objetos. Também conhecida como percentual corretamen- 
te classificado. 

Regressão logística Forma especial de regressão na qual a va- 
riável dependente é não-métrica, dicotômica (binária). Apesar 
de algumas diferenças, a maneira geral de interpretação é 
semelhante à da regressão linear. 

Tolerância Proporção da variação nas variáveis independentes 
não explicada pelas variáveis que já estão no modelo (função). 
Pode ser usada como proteção contra a multicolinearidade. 
Calculada como 1 — R7, onde RZ é a quantia de variância da 
variável independente i explicada por todas as outras variáveis 
independentes. Uma tolerância de O significa que a variável in- 
dependente sob consideração é uma combinação linear per- 
feita de variáveis independentes já no modelo. Uma tolerância 
de 1 significa que uma variável independente é totalmente in- 
dependente de outras variáveis que já estão no modelo. 

Transformação logit Transformação dos valores da variável 
dependente binária discreta da regressão logística em uma 
curva em S (curva logística) que representa a probabilidade 
de um evento. Essa probabilidade é então usada para formar 
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a razão de desigualdade, a qual atua como a variável depen- 
dente na regressão logística. 

Validação cruzada Procedimento de divisão da amostra em 
duas partes: a amostra de análise, usada na estimação da(s) 
função(ões) discriminante(s) ou do modelo de regressão lo- 
gística, e a amostra de teste, usada para validar os resultados. 
A validação cruzada evita o super-ajuste da função discrimi- 
nante ou da regressão logística, permitindo sua validação em 
uma amostra totalmente separada. 

Validação por partição de amostras Ver validação cruzada. 

Valor de verossimilhança Medida usada em regressão logís- 
tica para representar a falta de ajuste preditivo. Ainda que 
esses métodos não usem o procedimento dos mínimos qua- 
drados na estimação do modelo, como se faz em regressão 
múltipla, o valor de verossimilhança é parecido com a soma 
de erros quadrados na análise de regressão. 

Variável categórica Ver variável não-métrica. 

Variável estatística Combinação linear que representa a soma 
ponderada de duas ou mais variáveis independentes que for- 
mam a função discriminante. Também chamada de combina- 
ção linear ou composta linear. 

Variável métrica Variável com uma unidade constante de medi- 
da. Se uma variável métrica tem intervalo de 1 a 9, a diferença 
entre 1 e 2 é a mesma que aquela entre 8 e 9. Uma discussão 
mais completa de suas características e diferenças em rela- 
ção a uma variável não-métrica ou categórica é encontrada 
no Capítulo 1. 

Variável não-métrica Variável com valores que servem me- 
ramente como um rótulo ou meio de identificação, também 
conhecida como variável categórica, nominal, binária, quali- 
tativa ou taxonômica. O número de um uniforme de futebol é 
um exemplo. Uma discussão mais completa sobre suas ca- 
racterísticas e diferenças em relação a uma variável métrica é 
encontrada no Capítulo 1. 

Vetor Representação da direção e magnitude do papel de uma 
variável como retratada em uma interpretação gráfica de re- 
sultados da análise discriminante. 


O QUE SÃO ANÁLISE DISCRIMINANTE 
E REGRESSÃO LOGÍSTICA? 


Ao tentarmos escolher uma técnica analítica apropriada, 
às vezes encontramos um problema que envolve uma va- 
riável dependente categórica e várias variáveis indepen- 
dentes métricas. Por exemplo, podemos querer distinguir 
riscos de crédito bons de ruins. Se tivéssemos uma medida 
métrica de risco de crédito, poderíamos usar a regressão 
múltipla. Em muitos casos não temos a medida métrica 
necessária para regressão múltipla. Ao invés disso, somos 
capazes somente de verificar se alguém está em um grupo 
particular (p.ex., risco de crédito bom ou ruim). 

Análise discriminante e regressão logística são as téc- 
nicas estatísticas apropriadas quando a variável depen- 
dente é categórica (nominal ou não-métrica) e as variáveis 
independentes são métricas. Em muitos casos, a variável 


dependente consiste em dois grupos ou classificações, por 
exemplo, masculino versus feminino ou alto versus bai- 
xo. Em outros casos, mais de dois grupos são envolvidos, 
como as classificações em baixo, médio e alto. A análi- 
se discriminante é capaz de lidar com dois ou múltiplos 
(três ou mais) grupos. Quando duas classificações estão 
envolvidas, a técnica é chamada de análise discriminan- 
te de dois grupos. Quando três ou mais classificações são 
identificadas, a técnica é chamada de análise discriminante 
múltipla (MDA). A regressão logística, também conheci- 
da como análise logit, é limitada, em sua forma básica, a 
dois grupos, apesar de formulações alternativas poderem 
lidar com mais de dois grupos. 


Análise discriminante 


A análise discriminante envolve determinar uma variável 
estatística. Uma variável estatística discriminante é a com- 
binação linear das duas (ou mais) variáveis independentes 
que melhor discriminarão entre os objetos (pessoas, em- 
presas etc.) nos grupos definidos a priori. A discriminação 
é conseguida estabelecendo-se os pesos da variável esta- 
tística para cada variável independente para maximizar as 
diferenças entre os grupos (i.e., a variância entre grupos 
relativa à variância interna no grupo). A variável estatís- 
tica para uma análise discriminante, também conhecida 
como a função discriminante, é determinada a partir de 
uma equação que se parece bastante com aquela vista em 
regressão múltipla. Ela assume a seguinte forma: 


Ze = WAX + WXy too + WAX 


J 


onde 


Zy = escore Z discriminante da função discriminante 
j para o objeto k 
a =intercepto 
W, = peso discriminante para a variável indepen- 
dente i 
X, = variável independente i para o objeto k 


Como acontece com a variável estatística em regres- 
são ou qualquer outra técnica multivariada, percebemos 
o escore discriminante para cada objeto na análise (pes- 
soa, firma etc.) como sendo uma soma dos valores obtidos 
pela multiplicação de cada variável independente por seu 
peso discriminante. O que torna a análise discriminante 
única é que mais de uma função discriminante pode estar 
presente, resultando na possibilidade de que cada obje- 
to possa ter mais de um escore discriminante. Discutire- 
mos o que determina o número de funções discriminantes 
depois, mas aqui vemos que a análise discriminante tem 
semelhanças e diferenças quando comparada com outras 
técnicas multivariadas. 

A análise discriminante é a técnica estatística apro- 
priada para testar a hipótese de que as médias de grupo 
de um conjunto de variáveis independentes para dois ou 
mais grupos são iguais. Calculando a média dos escores 
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discriminantes para todos os indivíduos em um grupo 
particular, conseguimos a média do grupo. Essa média de 
grupo é chamada de centróide. Quando a análise envolve 
dois grupos, há dois centróides; com três grupos, há três 
centróides, e assim por diante. Os centróides indicam o 
local mais típico de qualquer indivíduo de um grupo par- 
ticular, e uma comparação dos centróides de grupos mos- 
tra o quão afastados estão os grupos em termos da função 
discriminante. 

O teste para a significância estatística da função discri- 
minante é uma medida generalizada da distância entre os 
centróides de grupos. Ela é computada comparando-se as 
distribuições dos escores discriminantes para os grupos. 
Se a sobreposição nas distribuições é pequena, a função 
discriminante separa bem os grupos. Se a sobreposição é 
grande, a função é um discriminador pobre entre os gru- 
pos. Duas distribuições de escores discriminantes mos- 
tradas na Figura 5-1 ilustram melhor esse conceito. O 
diagrama do alto representa as distribuições de escores 
discriminantes para uma função que separa bem os gru- 
pos, mostrando sobreposição mínima (a área sombreada) 
entre os grupos. O diagrama abaixo exibe as distribuições 
de escores discriminantes em uma função discriminan- 
te que é relativamente pobre entre os grupos A e B. As 
áreas sombreadas de sobreposição representam os casos 
nos quais podem ocorrer classificação ruim de objetos do 
grupo A no grupo B e vice-versa. 

A análise discriminante múltipla é única em uma ca- 
racterística entre as relações de dependência. Se a variável 
dependente consiste de mais do que dois grupos, a análise 
discriminante calcula mais de uma função discriminante. 
Na verdade, calcula NG — 1 funções, onde NG é o número 
de grupos. Cada função discriminante calcula um escore 


discriminante Z. No caso de uma variável dependente 
de três grupos, cada objeto (respondente, empresa etc.) 
terá um escore separado para funções discriminantes um 
e dois, permitindo que os objetos sejam representados 
graficamente em duas dimensões, com cada dimensão re- 
presentando uma função discriminante. Logo, a análise 
discriminante não está limitada a uma única variável esta- 
tística, como ocorre na regressão múltipla, mas cria múlti- 
plas variáveis estatísticas que representam dimensões de 
discriminação entre os grupos. 


Regressão logística 

A regressão logística é uma forma especializada de regres- 
são que é formulada para prever e explicar uma variável 
categórica binária (dois grupos), e não uma medida depen- 
dente métrica. A forma da variável estatística de regressão 
logística é semelhante à da variável estatística da regres- 
são múltipla. A variável estatística representa uma relação 
multivariada com coeficientes como os da regressão indi- 
cando o impacto relativo de cada variável preditora. 

As diferenças entre regressão logística e análise discri- 
minante ficarão mais claras em nossa discussão posterior, 
neste capítulo, sobre as características únicas da regressão 
logística. Mas também existem muitas semelhanças entre 
os dois métodos. Quando as suposições básicas de ambos 
são atendidas, eles oferecem resultados preditivos e classi- 
ficatórios comparáveis e empregam medidas diagnósticas 
semelhantes. A regressão logística, porém, tem a vanta- 
gem de ser menos afetada do que a análise discriminante 
quando as suposições básicas, particularmente a normali- 
dade das variáveis, não são satisfeitas. Ela também pode 
acomodar variáveis não-métricas por meio da codificação 


Função discriminante 


Função discriminante 


FIGURA 5-1 Representação univariada de escores Z discriminantes. 
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em variáveis dicotômicas, assim como a regressão. No en- 
tanto, a regressão logística é limitada a prever apenas uma 
medida dependente de dois grupos. Logo, em casos nos 
quais três ou mais grupos formam a medida dependente, a 
análise discriminante é mais adequada. 


ANALOGIA COM REGRESSÃO 
E MANOVA 


A aplicação e interpretação de análise discriminante são 
quase as mesmas da análise de regressão. Ou seja, a fun- 
ção discriminante é uma combinação linear (variável es- 
tatística) de medidas métricas para duas ou mais variáveis 
independentes e é usada para descrever ou prever uma 
única variável dependente. A diferença chave é que a aná- 
lise discriminante é adequada a problemas de pesquisa 
nos quais a variável dependente é categórica (nominal ou 
não-métrica), ao passo que a regressão é usada quando a 
variável dependente é métrica. Como discutido anterior- 
mente, a regressão logística é uma variante da regressão, 
tendo assim muitas semelhanças, exceto pelo tipo de va- 
riável dependente. 

A análise discriminante também é comparável à aná- 
lise multivariada de variância (MANOVA) “reversa”, a 
qual discutimos no Capítulo 6. Na análise discriminante, 
a variável dependente é categórica e as independentes 
são métricas. O oposto é verdadeiro em MANOVA, que 
envolve variáveis dependentes métricas e variável(eis) 
independente(s) categórica(s). As duas técnicas usam as 
mesmas medidas estatísticas de ajuste geral do modelo, 
como será visto a seguir neste e no próximo capítulo. 


EXEMPLO HIPOTÉTICO DE 
ANALISE DISCRIMINANTE 


A análise discriminante é aplicável a qualquer questão de 
pesquisa com o objetivo de entender a pertinência a gru- 
pos, seja de indivíduos (p. ex., clientes versus não-clien- 
tes), empresas (p. ex., lucrativas versus não-lucrativas), 
produtos (p. ex., de sucesso versus sem sucesso) ou qual- 
quer outro objeto que possa ser avaliado em uma série 
de variáveis independentes. Para ilustrar as premissas bá- 
sicas da análise discriminante, examinamos dois cenários 
de pesquisa, um envolvendo dois grupos (compradores 
versus não-compradores) e o outro, três grupos (níveis de 
comportamento de troca). A regressão logística opera de 
uma maneira comparável à da análise discriminante para 
dois grupos. Logo, não ilustramos especificamente a re- 
gressão logística aqui, adiando nossa discussão até uma 
consideração separada sobre a regressão logística poste- 
riormente neste capítulo. 


Uma análise discriminante de dois grupos: 
compradores versus não-compradores 


Suponha que a KitchenAid queira determinar se um 
de seus novos produtos — um processador de alimentos 
novo e aperfeiçoado — será comercialmente bem-suce- 
dido. Ao levar a cabo a investigação, a Kitchen Aid está 
interessada em identificar (se possível) os consumidores 
que comprariam o novo produto e os que não compra- 
riam. Em terminologia estatística, a Kitchen Aid gostaria 
de minimizar o número de erros que cometeria ao pre- 
ver quais consumidores comprariam o novo processador 
de alimentos e quais não. Para auxiliar na identificação 
de compradores potenciais, a Kitchen Aid planejou es- 
calas de avaliação em três características — durabilidade, 
desempenho e estilo — para serem usadas por consumi- 
dores para avaliar o novo produto. Em vez de confiar em 
cada escala como uma medida separada, a Kitchen Aid 
espera que uma combinação ponderada das três preveja 
melhor se um consumidor tem predisposição para com- 
prar o novo produto. 


A meta principal da análise discriminante é obter uma 
combinação ponderada das três escalas a serem usadas 
na previsão da possibilidade de um consumidor comprar 
o produto. Além de determinar se os consumidores que 
têm tendência para comprar o novo produto podem ser 
diferenciados daqueles que não têm, a Kitchen Aid tam- 
bém gostaria de saber quais características de seu novo 
produto são úteis na diferenciação entre compradores e 
não-compradores. Ou seja, avaliações de quais das três 
características do novo produto melhor separam compra- 
dores de não-compradores? 


Por exemplo, se a resposta “eu compraria” estiver sem- 
pre associada com uma medida de alta durabilidade, e a 
resposta “eu não compraria” estiver sempre associada 
com uma medida de baixa durabilidade, a Kitchen Aid 
concluirá que a característica de durabilidade distingue 
compradores de não-compradores. Em contrapartida, 
se a KitchenAid descobrisse que tantas pessoas com 
alta avaliação para estilo dissessem que comprariam o 
processador quanto aquelas que não comprariam, en- 
tão estilo seria uma característica que discrimina muito 
mal entre compradores e não-compradores. 


Identificação de variáveis discriminantes 

Para identificar variáveis que possam ser úteis na discrimina- 
ção entre grupos (ou seja, compradores versus não-compra- 
dores), coloca-se ênfase em diferenças de grupos em vez de 
medidas de correlação usadas em regressão múltipla. 
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A Tabela 5-1 lista as avaliações dessas três característi- 
cas do novo processador (com um preço especificado) 
por um painel de 10 compradores em potencial. Ao ava- 
liar o processador de alimentos, cada membro do painel 
estaria implicitamente comparando-o com produtos já 
disponíveis no mercado. Depois que o produto foi ava- 
liado, os avaliadores foram solicitados a estabelecer suas 
intenções de compra (“compraria” ou “não compraria”). 
Cinco disseram que comprariam o novo processador de 
alimentos, e cinco disseram que não comprariam. 

A Tabela 5-1 identifica diversas variáveis potencial- 
mente discriminantes. Primeiro, uma diferença subs- 
tancial separa as avaliações médias de X, (durabilida- 
de) para os grupos “compraria” e “não compraria” (7,4 
versus 3,2). Como tal, a durabilidade parece discriminar 
bem entre os grupos e ser uma importante característica 
para compradores em potencial. No entanto, a caracte- 
rística de estilo (X,) tem uma diferença menor, de 0,2, 
entre avaliações médias (4,0 — 3,8 = 0,2) para os grupos 
“compraria” e “não compraria”. Portanto, esperaríamos 
que essa característica fosse menos discriminante em ter- 
mos de uma decisão de compra. Contudo, antes que pos- 
samos fazer tais declarações de forma conclusiva, deve- 
mos examinar a distribuição de escores para cada grupo. 
Desvios-padrão grandes dentro de um ou dos dois grupos 
podem fazer a diferença entre médias não-significantes e 
inconsegiiente na discriminação entre os grupos. 

Como temos apenas 10 respondentes em dois grupos 
e três variáveis independentes, também podemos olhar 


os dados graficamente para determinar o que a análi- 
se discriminante está tentando conseguir. A Figura 5-2 
mostra os dez respondentes em cada uma das três variá- 
veis. O grupo “compraria” é representado por círculos e 
o grupo “não compraria”, por quadrados. Os números 
de identificação dos respondentes estão dentro das for- 
mas. 


e X, (Durabilidade) tem uma diferença substancial em 
escores médios, permitindo uma discriminação quase 
perfeita entre os grupos usando apenas essa variável. 
Se estabelecêssemos o valor de 5,5 como nosso ponto 
de corte para discriminar entre os dois grupos, então 
classificaríamos incorretamente apenas o respondente 5, 
um dos membros do grupo “compraria”. Esta variável 
ilustra o poder discriminatório ao se ter uma grande 
diferença nas médias para os dois grupos e uma falta de 
superposição entre as distribuições dos dois grupos. 

e X, (Desempenho) fornece uma distinção menos clara 
entre os dois grupos. No entanto, essa variável dá ele- 
vada discriminação para o respondente 5, o qual seria 
classificado incorretamente se usássemos apenas X,. 
Além disso, os respondentes que seriam mal classifica- 
dos usando X, estão bem separados em X,. Logo, X, e 
X, podem efetivamente ser usadas em combinação para 
prever a pertinência a grupo. 

e X, (Estilo) mostra pouca distinção entre os grupos. As- 
sim, formando-se uma variável estatística com apenas 
X,e X, e omitindo-se X,, pode-se formar uma função 
discriminante que maximize a separação dos grupos no 
escore discriminante. 


TABELA 5-1 


Resultados do levantamento da KitchenAid para avaliação de um novo produto 


Avaliação do novo produto* 


Grupos baseados em X, X, X; 
intenção de compra Durabilidade Desempenho Estilo 
Grupo 1: Compraria 
Indivíduo 1 8 9 6 
Indivíduo 2 6 7 5 
Indivíduo 3 10 6 3 
Indivíduo 4 9 4 4 
Indivíduo 5 4 8 2 
Média do grupo 74 6,8 4,0 
Grupo 2: Não compraria 
Indivíduo 6 5 4 7 
Indivíduo 7 3 7 2 
Indivíduo 8 4 5 5 
Indivíduo 9 2 4 3 
Indivíduo 10 2 2 2 
Média do grupo 3,2 4,4 3,8 
Diferença entre médias de grupos 4,2 2,4 0,2 


*Avaliações são feitas em uma escala de 10 pontos (de 1 = muito pobre a 10 = excelente). 
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FIGURA 5-2 Representação gráfica de 10 compradores potenciais sobre três variáveis discriminantes possíveis. 


Cálculo de uma função discriminante 

Com as três variáveis discriminantes potenciais identifica- 
das, a atenção se desvia para a investigação da possibilida- 
de de se usar as variáveis discriminantes em combinação 
para melhorar o poder discriminatório de qualquer variá- 
vel individual. Para este fim, uma variável estatística pode 
ser formada com duas ou mais variáveis discriminantes 
para atuarem juntas na discriminação entre grupos. 


A Tabela 5-2 contém os resultados para três diferentes 
formulações de funções discriminantes, cada uma repre- 
sentando diferentes combinações das três variáveis in- 
dependentes. 


e À primeira função discriminante contém apenas X,, 
igualando o valor de X, ao escore discriminante Z (tam- 
bém implicando um peso de 1,0 para X, e pesos nulos 
para as demais variáveis). Como discutido anteriormen- 
te, o uso de apenas X,, o melhor discriminador, resulta 
na classificação errônea do indivíduo 5, conforme se 
mostra na Tabela 5-2, onde quatro entre cinco indiví- 
duos do grupo 1 (todos exceto o 5) e cinco entre cinco 
indivíduos do grupo 2 estão corretamente classificados 
(i.e., estão na diagonal da matriz de classificação). O 
percentual corretamente classificado é, portanto, 90% 
(9 entre 10 sujeitos). 

e Como X, fornece discriminação para o sujeito 5, pode- 
mos formar uma segunda função discriminante combi- 
nando igualmente X, e X, (ou seja, implicando pesos de 
1,0 para X, e X,, e 0,0 para X,) para utilizar os poderes 
discriminatórios únicos de cada variável. Usando-se um 
escore de corte de 11 com essa nova função discriminan- 


te (ver Tabela 5-2), atinge-se uma perfeita classificação 
dos dois grupos (100% corretamente classificados). 
Logo, X, e X, em combinação são capazes de fazer 
melhores previsões de pertinência a grupos do que qual- 
quer variável separadamente. 

e À terceira função discriminante na Tabela 5-2 repre- 
senta a verdadeira função discriminante estimada (Z = 
—4,53 + 0,476X, + 0,359X,). Usando um escore de corte 
de 0, essa terceira função também atinge uma taxa de 
classificações corretas de 100%, com a máxima separa- 
ção possível entre os grupos. 


Como visto neste exemplo simples, a análise discri- 
minante identifica as variáveis com as maiores diferen- 
ças entre os grupos e deriva um coeficiente discriminante 
que pondera cada variável para refletir tais diferenças. O 
resultado é uma função discriminante que melhor distin- 
gue entre os grupos com base em uma combinação das 
variáveis independentes. 


Uma representação geométrica da 
função discriminante de dois grupos 


Uma ilustração gráfica de uma outra análise de dois 
grupos ajudará a explicar melhor a natureza da análise 
discriminante [7]. A Figura 5-3 demonstra o que acon- 
tece quando uma função discriminante de dois grupos 
é computada. Suponha que temos dois grupos, A e B, e 
duas medidas, V, e V,, para cada membro dos dois gru- 
pos. Podemos representar graficamente em um diagrama 
de dispersão a associação da variável V, com a variável 
V, para cada membro dos dois grupos. Na Figura 5-3, os 
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TABELA 5-2 Criação de funções discriminantes para prever compradores versus não- 


compradores 
Escores Z discriminantes calculados 
Função 1 Função 2 Função 3 
Grupo Z=X, Z=K+X Z 4,53 + 0,476X, + 0,359X, 
Grupo 1: Compraria 
Indivíduo 1 8 17 2,51 
Indivíduo 2 6 13 0,84 
Indivíduo 3 10 16 2,38 
Indivíduo 4 9 13 1,19 
Indivíduo 5 4 12 0,25 
Grupo 2: Não compraria 
Indivíduo 6 5 9 —0,71 
Indivíduo 7 3 10 —0,59 
Indivíduo 8 4 9 —0,83 
Indivíduo 9 2 6 -2,14 
Indivíduo 10 2 4 -2,86 
Escore de corte 5,5 11 0,0 


Precisão de classificação 


Grupo previsto 


Grupo previsto Grupo previsto 


Grupo real 1 2 1 2 1 2 
1: Compraria 4 1 5 0 5 0 
2: Não-compraria 0 5 0 5 0 5 


pontos pequenos* representam as medidas das variáveis 
para os membros do grupo B, e os pontos grandes* cor- 
respondem ao grupo A. As elipses desenhadas em tor- 
no dos pontos pequenos e grandes envolveriam alguma 
proporção pré-especificada dos pontos, geralmente 95% 
ou mais em cada grupo. Se desenharmos uma reta pelos 
dois pontos nos quais as elipses se interceptam e então 
projetarmos a reta sobre um novo eixo Z, podemos dizer 
que a sobreposição entre as distribuições univariadas A' 
e B' (representada pela área sombreada) é menor do que 
se fosse obtida por qualquer outra reta através das elipses 
formadas pelos diagramas de dispersão [7]. 

O importante a ser notado a respeito da Figura 5-3 é 
que o eixo Z expressa os perfis de duas variáveis dos gru- 
pos A e B como números únicos (escores discriminantes). 
Encontrando uma combinação linear das variáveis origi- 
nais V, e V,, podemos projetar os resultados como uma 
função discriminante. Por exemplo, se os pontos pequenos 
e grandes são projetados sobre o novo eixo Z como esco- 
res Z discriminantes, o resultado condensa a informação 
sobre diferenças de grupos (mostrada no gráfico V,V;) em 
um conjunto de pontos (escores Z) sobre um único eixo, 
mostrado pelas distribuições A' e B”. 

Para resumir, para um dado problema de análise dis- 
criminante, uma combinação linear das variáveis indepen- 
dentes é determinada, resultando em uma série de escores 
discriminantes para cada objeto em cada grupo. Os esco- 


*N. de R. T.: Na verdade, os pontos nos grupos A e B não diferem 
em tamanho e, sim, no formato. No A a forma é quadrada e no B é 
circular. 


res discriminantes são computados de acordo com a regra 
estatística de maximizar a variância entre os grupos e mini- 
mizar a variância dentro deles. Se a variância entre os gru- 
pos é grande em relação à variância dentro dos grupos, di- 
zemos que a função discriminante separa bem os grupos. 


Um exemplo de análise discriminante 
de três grupos: intenções de troca 


O exemplo de dois grupos já examinado demonstra o obje- 
tivo e o benefício de se combinarem variáveis independen- 
tes em uma variável estatística para fins de discriminação 
entre grupos. A análise discriminante também tem um ou- 
tro meio de discriminação — a estimação e o uso de múlti- 
plas variáveis estatísticas — em casos onde há três ou mais 
grupos. Essas funções discriminantes agora se tornam di- 
mensões de discriminação, sendo cada dimensão separada 
e diferente da outra. Assim, além de melhorar a explicação 
de pertinência ao grupo, essas funções discriminantes adi- 
cionais dão informação quanto às várias combinações de 
variáveis independentes que discriminam entre grupos. 


Para ilustrar uma aplicação de análise discriminante 
a três grupos, examinamos a pesquisa conduzida pela 
HBAT referente à possibilidade de os clientes de um 
concorrente trocarem de fornecedores. Um pré-teste em 
pequena escala envolveu entrevistas de 15 clientes de um 
concorrente importante. Durante as entrevistas, os clien- 
tes foram indagados sobre a probabilidade de trocarem 
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FIGURA 5-3 Ilustração gráfica da análise discriminante de dois grupos. 


(Continuação) 

de fornecedores em uma escala de três categorias. As 
três respostas possíveis eram “definitivamente trocaria”, 
“indeciso” e “definitivamente não trocaria”. Clientes fo- 
ram designados a grupos 1, 2 ou 3, respectivamente, de 
acordo com suas respostas. Os clientes também avalia- 
ram o concorrente em duas características: competitivi- 
dade de preço (X,) e nível de serviço (X,). A questão da 
pesquisa agora é determinar se as avaliações dos clientes 
a respeito do concorrente podem prever sua probabilida- 
de de trocar de fornecedor. Como a variável dependente 
de troca de fornecedor foi medida como uma variável ca- 
tegórica (não-métrica) e as medidas de preço e serviço 
são métricas, a análise discriminante é adequada. 


Identificação de variáveis discriminantes 

Com três categorias da variável dependente, a análise 
discriminante pode estimar duas funções discriminantes, 
cada uma representando uma dimensão diferente de dis- 
criminação. 


A Tabela 5-3 contém os resultados da pesquisa para os 
15 clientes, cinco em cada categoria da variável depen- 
dente. Como fizemos no exemplo de dois grupos, pode- 
mos olhar para os escores médios de cada grupo para 
ver se uma das variáveis discrimina bem entre todos os 
grupos. Para X,, competitividade de preço, percebemos 
uma grande diferença de médias entre o grupo 1 e os 
grupos 2 ou 3 (2,0 versus 4,6 ou 3,8). X, pode discrimi- 
nar bem entre o grupo 1 e os grupos 2 ou 3, mas é muito 
menos eficiente para discriminar entre os grupos 2 e 3. 
Para X,, nível de serviço, percebemos que a diferença 
entre os grupos 1 e 2 é muito pequena (2,0 versus 2,2), 
ao passo que há uma grande diferença entre o grupo 3 e 
os grupos 1 ou 2 (6,2 versus 2,0 ou 2,2). Logo, X, distin- 
gue o grupo 1 dos grupos 2 e 3, e X, diferencia o grupo 
3 dos grupos 1 e 2. Como resultado, vemos que X, e 
X, fornecem diferentes “dimensões” de discriminação 
entre os grupos. 
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TABELA 5-3 Resultados da pesquisa HBAT sobre intenções de troca por clientes potenciais 


Avaliação do fornecedor atual* 


Grupos baseados em X, X, 
intenção de troca Competitividade de preço Nível do serviço 


Grupo 1: Definitivamente trocaria 
Indivíduo 1 2 2 
Indivíduo 2 1 2 
Indivíduo 3 3 2 
Indivíduo 4 2 1 
Indivíduo 5 2 3 
Média do grupo 2,0 2,0 


Grupo 2: Indeciso 
Indivíduo 6 4 2 
Indivíduo 7 4 3 
Indivíduo 8 5 1 
Indivíduo 9 5 2 
Indivíduo 10 5 3 
Média do grupo 4,6 2,2 
Grupo 3: Definitivamente não trocaria 
Indivíduo 11 
Indivíduo 12 
Indivíduo 13 
Indivíduo 14 
Indivíduo 15 5 
Média do grupo 3,8 6,2 


(6 o 
“o ooo 


*Avaliações são feitas em uma escala de 10 pontos (de 1 = muito pobre a 10 = excelente). 


Cálculo de duas funções discriminantes Com as duas funções, agora podemos calcular dois es- 
Com as potenciais variáveis discriminantes identificadas, cores discriminantes para cada respondente. Além disso, 
o próximo passo é combiná-las em funções discriminantes as duas funções discriminantes fornecem as dimensões de 
que utilizarão seu poder combinado de diferenciação para — discriminação. 

separar grupos. 


A Figura 5-4 também contém um gráfico de cada respon- 
dente em uma representação bidimensional. A separa- 
ção entre grupos agora fica bastante clara, e cada grupo 
pode ser facilmente diferenciado. Podemos estabelecer 
valores em cada dimensão que definirão regiões conten- 
do cada grupo (p.ex., todos os membros do grupo 1 es- 
tão na região menos que 3,5 na dimensão 1 e menos que 
4,5 na dimensão 2). Cada um dos outros grupos pode ser 
analogamente definido em termos das amplitudes dos 
escores de suas funções discriminantes. 

Em termos de dimensões de discriminação, a primei- 
ra função discriminante, competitividade de preço, dife- 
rencia clientes indecisos (mostrados com um quadrado) 
de clientes que decidiram trocar (círculos). Mas compe- 
Função discriminante 1 = 1,0(X7) + 0,0(X,) titividade de preço não diferencia aqueles que decidiram 
Função discriminante 2 = 0,0(X,) + 1,0(X,) não trocar (losangos). Em vez disso, a percepção de ní- 
vel de serviço, que define a segunda função discriminan- 
te, prevê se um cliente decidirá não trocar versus se um 
cliente está indeciso ou determinado a trocar de forne- 


Para ilustrar graficamente essas dimensões, a Figura 5-4 
retrata os três grupos em cada variável independente se- 
paradamente. Vendo os membros dos grupos em qual- 
quer variável, podemos perceber que nenhuma variável 
discrimina bem entre todos os grupos. Mas se construí- 
mos duas funções discriminantes simples, usando apenas 
pesos simples de 1,0 e 0,0, os resultados se tornam mui- 
to mais claros. A função discriminante 1 dá para X, um 
peso de 1,0, e para X, um peso de 0,0. Do mesmo modo, 
a função discriminante 2 dá para X, um peso de 1,0 e 
para X, um peso de 0,0. As funções podem ser enuncia- 
das matematicamente como 


Essas equações mostram em termos simples como o 
procedimento de análise discriminante estima os pesos 
para maximizar a discriminação. 
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(Continuação) A estimação de mais de uma função discriminante, 
cedores. O pesquisador pode apresentar à gerência os quando possível, fornece ao pesquisador uma discrimina- 
impactos separados de competitividade de preço e nível ção melhorada e perspectivas adicionais sobre as caracte- 
de serviço para a tomada de decisões. rísticas e as combinações que melhor discriminam entre os 

grupos. As seções a seguir detalham os passos necessários 


(a) variáveis individuais 45 


(5) 10 
O <> P 9 
(e) O 6 lol lb 
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(b) Representação Função 
bidimensional de discriminante 2 
funções discriminantes 
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FIGURA 5-4 Representação gráfica de variáveis discriminantes potenciais para uma análise discriminante de três grupos. 
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para se executar uma análise discriminante, avaliar seu ní- 
vel de ajuste preditivo e então interpretar a influência de 
variáveis independentes ao se fazer uma previsão. 


O PROCESSO DE DECISÃO PARA 
ANÁLISE DISCRIMINANTE 


A aplicação de análise discriminante pode ser vista da 
perspectiva da construção de modelo de seis estágios in- 
troduzida no Capítulo 1 e retratada na Figura 5-5 (está- 
gios 1-3) e na Figura 5-6 (estágios 4-6). Assim como em 
todas as aplicações multivariadas, estabelecer os objetivos 
é o primeiro passo na análise. Em seguida, o pesquisa- 
dor deve abordar questões específicas de planejamento e 
se certificar de que as suposições inerentes estão sendo 
atendidas. A análise continua com a dedução da função 
discriminante e a determinação de se uma função esta- 
tisticamente significante pode ser obtida para separar os 
dois (ou mais) grupos. Os resultados discriminantes são 
então avaliados quanto à precisão preditiva pelo desen- 
volvimento de uma matriz de classificação. Em seguida, a 
interpretação da função discriminante determina qual das 
variáveis independentes mais contribui para discriminar 
entre os grupos. Finalmente, a função discriminante deve 
ser validada com uma amostra de teste. Cada um desses 
estágios é discutido nas seções a seguir. Discutimos a re- 
gressão logística em uma seção à parte depois de exami- 


narmos o processo de decisão para a análise discriminan- 
te. Desse modo, as semelhanças e diferenças entre essas 
duas técnicas podem ser destacadas. 


ESTÁGIO 1: OBJETIVOS DA 
ANALISE DISCRIMINANTE 


Uma revisão dos objetivos de aplicar a análise discrimi- 
nante deve esclarecer melhor sua natureza. A análise dis- 
criminante pode abordar qualquer um dos seguintes obje- 
tivos de pesquisa: 


1. Determinar se existem diferenças estatisticamente signifi- 
cantes entre os perfis de escore médio em um conjunto de 
variáveis para dois (ou mais) grupos definidos a priori. 
Determinar quais das variáveis independentes explicam o 
máximo de diferenças nos perfis de escore médio dos dois 
ou mais grupos. 

Estabelecer o número e a composição das dimensões de dis- 
criminação entre grupos formados a partir do conjunto de 
variáveis independentes. 

Estabelecer procedimentos para classificar objetos (indiví- 
duos, firmas, produtos e assim por diante) em grupos, com 
base em seus escores em um conjunto de variáveis indepen- 
dentes. 


Como observado nesses objetivos, a análise discrimi- 
nante é útil quando o pesquisador está interessado em 
compreender diferenças de grupos ou em classificar obje- 


Estágio 1 


Problema de pesquisa 


Selecione objetivo(s): 


Calcule diferenças de grupo em um perfil multivariado 
Classifique observações em grupos 
identifique dimensões de discriminação entre grupos 


| 


Estágio 2 


Questões de planejamento de pesquisa 


Seleção de variáveis independentes 
Considerações sobre tamanho de amostra 
Criação de amostras de análise e teste 
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Estágio 3 


Suposições 


Normalidade de variáveis independentes 

Linearidade de relações 

Falta de multicolinearidade entre variáveis independentes 
Matrizes de dispersão iguais 


FIGURA 5-5 
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Estágios 1-3 no diagrama de decisão da análise discriminante. 
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tos corretamente em grupos ou classes. Portanto, a análi- 
se discriminante pode ser considerada um tipo de análise 
de perfil ou uma técnica preditiva analítica. Em qualquer 
caso, a técnica é mais apropriada onde existe uma só va- 
riável dependente categórica e diversas variáveis indepen- 
dentes métricas. 


e Como uma análise de perfil, a análise discriminante fornece 
uma avaliação objetiva de diferenças entre grupos em um 
conjunto de variáveis independentes. Nesta situação, a aná- 
lise discriminante é bastante semelhante à análise multiva- 
riada de variância (ver Capítulo 6 para uma discussão mais 
detalhada de análise multivariada de variância). Para enten- 
der as diferenças de grupos, a análise discriminante permite 
discernir o papel de variáveis individuais, bem como definir 
combinações dessas variáveis que representam dimensões 
de discriminação entre grupos. Essas dimensões são os efei- 
tos coletivos de diversas variáveis que trabalham conjunta- 
mente para distinguir entre os grupos. O uso de métodos de 
estimação sequenciais também permite identificar subcon- 
juntos de variáveis com o maior poder discriminatório. 

e Para fins de classificação, a análise discriminante fornece 
uma base para classificar não somente a amostra usada para 
estimar a função discriminante, mas também quaisquer ou- 
tras observações que possam ter valores para todas as va- 
riáveis independentes. Desse modo, a análise discriminante 
pode ser usada para classificar outras observações nos gru- 
pos definidos. 


ESTÁGIO 2: PROJETO DE PESQUISA 
PARA ANALISE DISCRIMINANTE 


A aplicação bem-sucedida da análise discriminante requer 
a consideração de várias questões. Tais questões incluem 
a seleção da variável dependente e das variáveis indepen- 
dentes, o tamanho necessário da amostra para a estima- 
ção das funções discriminantes, e a divisão da amostra 
para fins de validação. 


Seleção de variáveis dependente 
e independentes 


Para aplicar a análise discriminante, o pesquisador deve 
primeiramente especificar quais variáveis devem ser inde- 
pendentes e qual deve ser a medida dependente. Lembre- 
se que a variável dependente é categórica e as indepen- 
dentes são métricas. 


A variável dependente 

O pesquisador deve se concentrar na variável dependente 
primeiro. O número de grupos (categorias) da variável de- 
pendente pode ser dois ou mais, mas esses grupos devem 
ser mutuamente excludentes e cobrir todos os casos. Ou 
seja, cada observação pode ser colocada em apenas um 
grupo. Em alguns casos, a variável dependente pode en- 
volver dois grupos (dicotômicas), como bom versus ruim. 
Em outros casos, a variável dependente envolve vários 


grupos (multicotômica), como as ocupações de médico, 
advogado ou professor. 


Quantas categorias na variável dependente? Teorica- 
mente, a análise discriminante pode lidar com um número 
ilimitado de categorias na variável dependente. Na práti- 
ca, porém, o pesquisador deve selecionar uma variável de- 
pendente e o número de categorias com base em diversas 
considerações. 


1. Além de serem mutuamente excludentes e exaustivas, as 
categorias da variável dependente devem ser distintas e 
únicas no conjunto escolhido de variáveis independentes. A 
análise discriminante considera que cada grupo deveria ter 
um perfil único nas variáveis independentes usadas, e assim 
desenvolve as funções discriminantes para separar ao má- 
ximo os grupos com base nessas variáveis. Não obstante, a 
análise discriminante não tem um meio para acomodar ou 
combinar categorias que não sejam distintas nas variáveis 
independentes. Se dois ou mais grupos têm perfis semelhan- 
tes, a análise discriminante não será capaz de estabelecer 
univocamente o perfil de cada grupo, resultando em uma 
explicação e classificação mais pobres dos grupos como um 
todo. Dessa forma, o pesquisador deve escolher as variáveis 
dependentes e suas categorias para refletir diferenças nas 
variáveis independentes. Um exemplo ajudará a ilustrar 
este ponto. 


Imagine que o pesquisador deseja identificar diferen- 
ças entre categorias ocupacionais baseado em algumas 
características demográficas (p.ex., renda, formação, 
características familiares). Se ocupações fossem repre- 
sentadas por um pequeno número de categorias (p.ex., 
pessoal de segurança e limpeza, técnicos, pessoal de es- 
critório e profissionais de nível superior), então espera- 
ríamos que houvesse diferenças únicas entre os grupos 
e que a análise discriminante seria mais adequada para 
desenvolver funções discriminantes que explicariam as 
distinções de grupos e classificariam com sucesso os indi- 
víduos em suas categorias corretas. 

Se, porém, o número de categorias ocupacionais fos- 
se aumentado, a análise discriminante poderia ter uma 
dificuldade maior para identificar diferenças. Por exem- 
plo, considere que a categoria de profissionais de nível 
superior fosse expandida para as categorias de médicos, 
advogados, gerentes gerais, professores universitários e 
assim por diante. A despeito de esta expansão fornecer 
uma classificação ocupacional mais refinada, seria muito 
mais difícil fazer distinções entre essas categorias com 
base em variáveis demográficas. Os resultados teriam 
um desempenho mais pobre na análise discriminante, 
tanto em termos de explicação quanto de classificação. 


2. O pesquisador deve também buscar um número menor, e 
não maior, de categorias na medida dependente. Pode pare- 
cer mais lógico expandir o número de categorias em busca 
de mais agrupamentos únicos, mas a expansão do número 
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de categorias apresenta mais complexidades nas tarefas de 
classificação e estabelecimento de perfil na análise discrimi- 
nante. Se a análise discriminante pode estimar NG — 1 (nú- 
mero de grupos menos um) funções discriminantes, então o 
aumento do número de grupos expande o número de pos- 
síveis funções discriminantes, aumentando a complexidade 
da identificação das dimensões inerentes de discriminação 
refletidas por conta de cada função discriminante, bem 
como representando o efeito geral de cada variável inde- 
pendente. 


Como esses dois pontos sugerem, o pesquisador sem- 
pre deve equilibrar a vontade de expandir as categorias 
em favor da unicidade (exclusividade) com a crescente 
efetividade de um número menor de categorias. O pesqui- 
sador deve testar e selecionar uma variável dependente 
com categorias que tenham as maiores diferenças entre 
todos os grupos, ao mesmo tempo que mantenham supor- 
te conceitual e relevância administrativa. 


Conversão de variáveis métricas Os exemplos anteriores 
de variáveis categóricas eram verdadeiras dicotomias (ou 
multicotomias). Há algumas situações, contudo, em que 
a análise discriminante é apropriada mesmo se a variável 
dependente não é verdadeiramente categórica (não-mé- 
trica). Podemos ter uma variável dependente de medida 
ordinal ou intervalar, a qual queremos usar como uma 
variável dependente categórica. Em tais casos, teríamos 
de criar uma variável categórica, e duas abordagens estão 
entre as mais usuais: 


e O método mais comum é estabelecer categorias usando uma 
escala métrica. Por exemplo, se tivéssemos uma variável que 
medisse o número médio de refrigerantes consumidos por 
dia e os indivíduos respondessem em uma escala de zero a 
oito ou mais por dia, poderíamos criar uma tricotomia (três 
grupos) artificial simplesmente designando aqueles indiví- 
duos que consumissem nenhum, um ou dois refrigerantes 
por dia como usuários modestos, aqueles que consumissem 
três, quatro ou cinco por dia como usuários médios, e os que 
consumissem seis, sete, oito ou mais como usuários pesados. 
Tal procedimento criaria uma variável categórica de três 
grupos na qual o objetivo seria discriminar entre usuários 
de refrigerantes que fossem modestos, médios e pesados. 
Qualquer número de grupos categóricos artificiais pode ser 
desenvolvido. Mais frequentemente, a abordagem envolve- 
ria a criação de duas, três ou quatro categorias. Um número 
maior de categorias poderia ser estabelecido se houvesse 
necessidade. 

e Quando três ou mais categorias são criadas, surge a possi- 
bilidade de se examinarem apenas os grupos extremos em 
uma análise discriminante de dois grupos. A abordagem de 
extremos polares envolve a comparação somente dos dois 
grupos extremos e a exclusão do grupo do meio da análise 
discriminante. Por exemplo, o pesquisador poderia examinar 
os usuários modestos e pesados de refrigerantes e excluir os 
usuários médios. Esse tratamento pode ser usado toda vez 
que o pesquisador desejar olhar apenas os grupos extremos. 
Contudo, ele também pode querer tentar essa abordagem 
quando os resultados de uma análise de regressão não são 


tão bons quanto o previsto. Tal procedimento pode ser útil 
porque é possível que diferenças de grupos possam aparecer 
até quando os resultados de regressão são pobres. Ou seja, 
a abordagem de extremos polares com a análise discrimi- 
nante pode revelar diferenças que não são tão evidentes em 
uma análise de regressão do conjunto completo de dados 
[7]. Tal manipulação dos dados naturalmente necessitaria 
de cuidado na interpretação das descobertas. 


As variáveis independentes 

Depois de ter tomado uma decisão sobre a variável de- 
pendente, o pesquisador deve decidir quais variáveis 
independentes serão incluídas na análise. As variáveis 
independentes geralmente são selecionadas de duas ma- 
neiras. A primeira abordagem envolve a identificação de 
variáveis a partir de pesquisa prévia ou do modelo teórico 
que é a base inerente da questão de pesquisa. A segun- 
da abordagem é a intuição — utilizar o conhecimento do 
pesquisador e selecionar intuitivamente variáveis para as 
quais não existe pesquisa prévia ou teoria, mas que logi- 
camente poderiam ser relacionadas à previsão dos grupos 
para a variável dependente. 

Em ambos os casos, as variáveis independentes mais 
apropriadas são aquelas que diferem da variável depen- 
dente em pelo menos dois dos grupos. Lembre que o pro- 
pósito de qualquer variável independente é apresentar um 
perfil único de pelo menos um grupo quando comparado 
a outros. Variáveis que não diferem ao longo dos grupos 
são de pouca utilidade em análise discriminante. 


Tamanho da amostra 


A análise discriminante, como as outras técnicas multi- 
variadas, é afetada pelo tamanho da amostra sob análise. 
Como discutido no Capítulo 1, amostras muito pequenas 
têm grandes erros amostrais, de modo que a identifica- 
ção de todas, exceto as grandes diferenças, é improvável. 
Além disso, amostras muito grandes tornarão todas as 
diferenças estatisticamente significantes, ainda que essas 
mesmas diferenças possam ter pouca ou nenhuma rele- 
vância administrativa. Entre esses extremos, o pesquisa- 
dor deve considerar o impacto do tamanho das amostras 
sobre a análise discriminante, tanto no nível geral quanto 
em uma base de grupo-por-grupo. 


Tamanho geral da amostra 

A primeira consideração envolve o tamanho geral da 
amostra. A análise discriminante é bastante sensível à 
proporção do tamanho da amostra em relação ao número 
de variáveis preditoras. Como resultado, muitos estudos 
sugerem uma proporção de 20 observações para cada va- 
riável preditora. Apesar de essa proporção poder ser di- 
fícil de manter na prática, o pesquisador deve notar que 
os resultados se tornam instáveis quando o tamanho da 
amostra diminui em relação ao número de variáveis inde- 
pendentes. O tamanho mínimo recomendado é de cinco 
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observações por variável independente. Note que essa 
proporção se aplica a todas as variáveis consideradas na 
análise, mesmo que todas as variáveis consideradas não 
entrem na função discriminante (como na estimação ste- 
pwise). 


Tamanho da amostra por categoria 

Além do tamanho da amostra geral, o pesquisador tam- 
bém deve considerar o tamanho da amostra de cada 
categoria. No mínimo, o menor grupo de uma catego- 
ria deve exceder o número de variáveis independentes. 
Como uma orientação prática, cada categoria deve ter 
no mínimo 20 observações. Mas mesmo que todas as 
categorias excedam 20 observações, o pesquisador tam- 
bém deve considerar os tamanhos relativos das mesmas. 
Se os grupos variam muito em tamanho, isso pode cau- 
sar impacto na estimação da função discriminante e na 
classificação de observações. No estágio de classificação, 
grupos maiores têm uma chance desproporcionalmente 
maior de classificação. Se os tamanhos de grupos variam 
muito, o pesquisador pode querer extrair uma amostra 
aleatoriamente a partir do(s) grupo(s) maior(es), redu- 
zindo assim seu(s) tamanho(s) a um nível comparável 
ao(s) grupo(s) menor(es). Sempre se lembre, porém, de 
manter um tamanho adequado de amostra geral e para 
cada grupo. 


Divisão da amostra 


Uma observação final sobre o impacto do tamanho da 
amostra na análise discriminante. Como será posterior- 
mente discutido no estágio 6, a maneira preferida de va- 
lidar uma análise discriminante é dividir a amostra em 
duas sub-amostras, uma usada para estimação da função 
discriminante e outra para fins de validação. Em termos 
de considerações sobre tamanho amostral, é essencial 
que cada sub-amostra tenha tamanho adequado para su- 
portar as conclusões dos resultados. Dessa forma, todas 
as considerações discutidas na seção anterior se aplicam 
não somente à amostra total, mas agora a cada uma das 
duas sub-amostras (especialmente aquela usada para esti- 
mação). Nenhuma regra rígida e rápida foi desenvolvida, 
mas parece lógico que o pesquisador queira pelo menos 
100 na amostra total para justificar a divisão da mesma em 
dois grupos. 


Criação das sub-amostras 

Vários procedimentos têm sido sugeridos para dividir a 
amostra em sub-amostras. O procedimento usual é divi- 
dir a amostra total de respondentes aleatoriamente em 
dois grupos. Um deles, a amostra de análise, é usado para 
desenvolver a função discriminante. O segundo grupo, a 
amostra de teste, é usado para testar a função discrimi- 
nante. Esse método de validação da função é chamado de 
abordagem de partição da amostra ou validação cruzada 
[1,5,9,18]. 


Nenhuma orientação definitiva foi estabelecida para 
determinar os tamanhos relativos das sub-amostras de 
análise e de teste (ou validação). O procedimento mais 
popular é dividir a amostra total de forma que metade 
dos respondentes seja colocada na amostra de análise e a 
outra metade na amostra de teste. No entanto, nenhuma 
regra rígida e rápida foi estabelecida, e alguns pesquisa- 
dores preferem uma partição 60-40 ou mesmo 75-25 entre 
os grupos de análise e de teste, dependendo do tamanho 
da amostra geral. 

Quando se selecionam as amostras de análise e teste, 
geralmente segue-se um procedimento de amostragem 
proporcionalmente estratificada. Assuma primeiro que 
o pesquisador deseja uma divisão 50-50. Se os grupos 
categóricos para a análise discriminante são igualmen- 
te representados na amostra total, as amostras de esti- 
mação e de teste devem ser de tamanhos aproximada- 
mente iguais. Se os grupos originais são diferentes, os 
tamanhos das amostras de estimação e de teste devem 
ser proporcionais em relação à distribuição da amostra 
total. Por exemplo, se uma amostra consiste em 50 ho- 
mens e 50 mulheres, as amostras de estimação e de tes- 
te teriam 25 homens e 25 mulheres cada. Se a amostra 
tiver 70 mulheres e 30 homens, então as amostras de 
estimação e de teste consistirão em 35 mulheres e 15 
homens cada. 


E sea amostra geral for muito pequena? 

Se a amostra é muito pequena para justificar uma divisão 
em grupos de análise e de teste, o pesquisador tem duas 
opções. Primeiro, desenvolver a função na amostra inteira 
e então usar a função para classificar o mesmo grupo usa- 
do para desenvolver a função. Esse procedimento resulta 
em um viés ascendente na precisão preditiva da função, 
mas certamente é melhor do que não testar a função de 
forma alguma. Segundo, diversas técnicas discutidas no 
estágio 6 podem desempenhar um tipo de procedimento 
de teste no qual a função discriminante é repetidamen- 
te estimada sobre a amostra, cada vez reservando uma 
observação diferente para previsão. Nesta abordagem, 
amostras muito menores podem ser usadas, pois a amos- 
tra geral não precisa ser dividida em sub-amostras. 


ESTÁGIO 3: SUPOSIÇÕES DA 
ANÁLISE DISCRIMINANTE 


Como ocorre em todas as técnicas multivariadas, a aná- 
lise discriminante é baseada em uma série de suposições. 
Tais suposições se relacionam a processos estatísticos en- 
volvidos nos procedimentos de estimação e classificação 
e a questões que afetam a interpretação dos resultados. 
A seção a seguir discute cada tipo de suposição e os im- 
pactos sobre a aplicação apropriada da análise discrimi- 
nante. 
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Impactos sobre estimação e classificação 


As suposições-chave para determinar a função discrimi- 
nante são a de normalidade multivariada das variáveis 
independentes, e a de estruturas (matrizes) de dispersão 
e covariância desconhecidas (mas iguais) para os grupos 
como definidos pela variável dependente [8,10]. Existem 
evidências da sensibilidade da análise discriminante a vio- 
lações dessas suposições. Os testes para normalidade dis- 
cutidos no Capítulo 2 estão disponíveis ao pesquisador, 
juntamente com o teste M de Box para avaliar a simila- 
ridade das matrizes de dispersão das variáveis indepen- 
dentes entre os grupos. Se as suposições são violadas, o 
pesquisador deve considerar métodos alternativos (p.ex., 
regressão logística, descrita na próxima seção) e com- 
preender os impactos sobre os resultados que podem ser 
esperados. 


Impacto sobre estimação 

Dados que não atendem a suposição de normalidade mul- 
tivariada podem causar problemas na estimação da função 
discriminante. Ações corretivas podem ser viáveis através 
de transformações dos dados para reduzir as disparidades 
entre as matrizes de covariância. No entanto, em muitos 
casos essas ações corretivas são ineficientes. Em tais casos, 
os modelos devem ser diretamente validados. Se a medida 
dependente é binária, a regressão logística deve ser utili- 
zada sempre que possível. 


Impacto sobre classificação 

Matrizes de covariância desiguais também afetam negati- 
vamente o processo de classificação. Se os tamanhos das 
amostras são pequenos e as matrizes de covariância são 
diferentes, então a significância estatística do processo de 
estimação é afetada adversamente. O caso mais comum 
é o de covariâncias desiguais entre grupos de tamanho 
adequado, em que as observações são super-classificadas 
nos grupos com matrizes de covariância maiores. Esse 
efeito pode ser minimizado aumentando-se o tamanho 
da amostra e também usando-se as matrizes de covariân- 
cia específicas dos grupos para fins de classificação, mas 
essa abordagem exige a validação cruzada dos resultados 
discriminantes. Finalmente, técnicas de classificação qua- 
dráticas estão disponíveis em muitos dos programas esta- 
tísticos caso existam grandes diferenças entre as matrizes 
de covariância dos grupos e as ações corretivas não mini- 
mizem o efeito [6,12,14]. 


Impactos sobre interpretação 


Uma outra característica dos dados que afeta os resultados 
é a multicolinearidade entre as variáveis independentes. 
A multicolinearidade, medida em termos de tolerância, 
denota que duas ou mais variáveis independentes estão 
altamente correlacionadas, de modo que uma variável 
pode ser altamente explicada ou prevista pela(s) outra(s) 


variável(eis), acrescentando pouco ao poder explicativo 
do conjunto como um todo. Essa consideração se torna 
especialmente crítica quando procedimentos stepwise são 
empregados. O pesquisador, ao interpretar a função discri- 
minante, deve estar ciente da multicolinearidade e de seu 
impacto na determinação de quais variáveis entram na so- 
lução stepwise. Para uma discussão mais detalhada da mul- 
ticolinearidade e seu impacto nas soluções stepwise, ver O 
Capítulo 4. Os procedimentos para detectar a presença da 
multicolinearidade são também abordados no Capítulo 4. 

Como em qualquer técnica multivariada que emprega 
uma variável estatística, uma suposição implícita é a de 
que todas as relações são lineares. As relações não-line- 
ares não são refletidas na função discriminante, a menos 
que transformações específicas de variáveis sejam executa- 
das para representarem efeitos não-lineares. Finalmente, 
observações atípicas podem ter um impacto substancial na 
precisão de classificação de quaisquer resultados da aná- 


REGRAS PRÁTICAS 5-1 


Planejamento de análise discriminante 


A variável dependente deve ser não-métrica, 

representando grupos de objetos que devem diferir nas 

variáveis independentes 

Escolha uma variável dependente que: 

e Melhor represente diferenças de grupos de interesse 

e Defina grupos que são substancialmente distintos 

e Minimize o número de categorias ao mesmo tempo 
que atenda aos objetivos da pesquisa 

Ao converter variáveis métricas para uma escala 

não-métrica para uso como a variável dependente, 

considere o uso de grupos extremos para maximizar as 

diferenças de grupos 

Variáveis independentes devem identificar diferenças 

entre pelo menos dois grupos para uso em análise 

discriminante 


A amostra deve ser grande o bastante para: 

e Ter pelo menos uma observação a mais por grupo 
do que o número de variáveis independentes, mas 
procurar por pelo menos 20 casos por grupo 
Ter 20 casos por variável independente, com um 
nível mínimo recomendado de 5 observações por 
variável 


Ter uma amostra grande o bastante para dividi-la 
em amostras de teste e de estimação, cada uma 
atendendo às exigências acima 
A suposição mais importante é a igualdade das matrizes 
de covariância, o que afeta tanto estimação quanto 
classificação 
Multicolinearidade entre as variáveis independentes 
pode reduzir sensivelmente o impacto estimado de 
variáveis independentes na função discriminante 
derivada, particularmente no caso de emprego de um 
processo de estimação stepwise 
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lise discriminante. O pesquisador é encorajado a exami- 
nar todos os resultados quanto à presença de observações 
atípicas e a eliminar observações atípicas verdadeiras, se 
necessário. Para uma discussão sobre algumas das técnicas 
que avaliam as violações das suposições estatísticas básicas 
ou a detecção de observações atípicas, ver Capítulo 2. 


ESTÁGIO 4: ESTIMAÇÃO DO 
MODELO DISCRIMINANTE E 
AVALIAÇÃO DO AJUSTE GERAL 


Para determinar a função discriminante, o pesquisador 
deve decidir o método de estimação e então determinar o 


Do 
estágio 
3 


número de funções a serem retidas (ver Figura 5-6). Com 
as funções estimadas, o ajuste geral do modelo pode ser 
avaliado de diversas maneiras. Primeiro, escores Z discri- 
minantes, também conhecidos como os escores Z, podem 
ser calculados para cada objeto. A comparação das mé- 
dias dos grupos (centróides) nos escores Z fornece uma 
medida de discriminação entre grupos. A precisão predi- 
tiva pode ser medida como o número de observações clas- 
sificadas nos grupos corretos, com vários critérios dispo- 
níveis para avaliar se o processo de classificação alcança 
significância prática ou estatística. Finalmente, diagnósti- 
cos por casos podem identificar a precisão de classificação 
de cada caso e seu impacto relativo sobre a estimação ge- 
ral do modelo. 


Estágio 4 


Estimação das funções discriminantes 


Estimação simultânea ou stepwise 
Significância de funções discriminantes 


Avaliação de precisão preditiva com 


matrizes de classificação 


Determinar escore de corte ótimo 
Especificar critério para avaliação de razão de sucesso 
Significância estatística de precisão preditiva 


Estágio 5 


Interpretação das funções discriminantes 


Duas 


— Uma 


Avaliação da função 


Quantas funções serão interpretadas? 


ou mais 


â Avaliação de funções separadas D' 


Pesos discriminantes 
Cargas discriminantes 
Valores F parciais 


Pesos discriminantes 
Cargas discriminantes 


| Valores F parciais ) 


á Avaliação de funções combinadas N 


Rotação de funções 

Indice de potência 

Representação gráfica de centróides 
de grupos 

Representação gráfica de cargas 


Estágio 6 


Validação dos resultados discriminantes 


Amostra particionada ou validação cruzada 
Perfil de diferenças de grupos 


FIGURA 5-6 Estágios 4-6 no diagrama de decisão da análise discriminante. 
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Seleção de um método de estimação 


A primeira tarefa na obtenção da função discriminante é 
selecionar o método de estimação. Ao fazer tal escolha, 
o pesquisador deve balancear a necessidade de controle 
sobre o processo de estimação com o desejo pela parci- 
mônia nas funções discriminantes. Os dois métodos dis- 
poníveis são o simultâneo (direto) e o stepwise, cada um 
discutido adiante. 


Estimação simultânea 

A estimação simultânea envolve a computação da fun- 
ção discriminante, de modo que todas as variáveis inde- 
pendentes são consideradas juntas. Assim, a função dis- 
criminante é computada com base no conjunto inteiro 
de variáveis independentes, sem consideração do poder 
discriminatório de cada uma delas. O método simultã- 
neo é apropriado quando, por conta de razões teóricas, o 
pesquisador quer incluir todas as variáveis independen- 
tes na análise e não está interessado em ver resultados 
intermediários baseados apenas nas variáveis mais dis- 
criminantes. 


Estimação stepwise 

A estimação stepwise é uma alternativa à abordagem si- 
multânea. Envolve a inclusão das variáveis independentes 
na função discriminante, uma por vez, com base em seu 
poder discriminatório. A abordagem stepwise segue um 
processo sequencial de adicionar ou descartar variáveis da 
seguinte maneira: 


1. Escolher a melhor variável discriminatória. 

2. Comparar a variável inicial com cada uma das outras variá- 
veis independentes, uma de cada vez, e selecionar a variável 
mais adequada para melhorar o poder discriminatório da 
função em combinação com a primeira variável. 

3. Selecionar as demais variáveis de maneira semelhante. Note 
que conforme variáveis adicionais são incluídas, algumas 
previamente escolhidas podem ser removidas se a infor- 
mação que elas contêm sobre diferenças de grupos estiver 
disponível em alguma combinação das outras variáveis in- 
cluídas em estágios posteriores. 

4. Considerar o processo concluído quando todas as variáveis 
independentes forem incluídas na função ou as variáveis ex- 
cluídas forem julgadas como não contribuindo significante- 
mente para uma discriminação futura. 


O método stepwise é útil quando o pesquisador quer 
considerar um número relativamente grande de variáveis 
independentes para inclusão na função. Selecionando-se 
sequencialmente a próxima melhor variável discriminante 
em cada passo, as variáveis que não são úteis na discrimi- 
nação entre os grupos são eliminadas e um conjunto re- 
duzido de variáveis é identificado. O conjunto reduzido 
geralmente é quase tão bom quanto — e às vezes melhor 
que — o conjunto completo de variáveis. 

O pesquisador deve notar que a estimação stepwise se 
torna menos estável e generalizável à medida que a pro- 
porção entre tamanho da amostra e variável independente 


diminui abaixo do nível recomendado de 20 observações 
por variável independente. É particularmente importan- 
te, nesses casos, validar os resultados de tantas maneiras 
quanto possível. 


Significância estatística 

Após a estimação da função discriminante, o pesquisador 
deve avaliar o nível de significância para o poder discrimi- 
natório coletivo das funções discriminantes, bem como a 
significância de cada função discriminante em separado. A 
avaliação da significância geral fornece ao pesquisador a 
informação necessária para decidir se deve proceder com 
ainterpretação da análise ou se uma reespecificação se faz 
necessária. Se o modelo geral for significante, a avaliação 
das funções individuais identifica aquelas que devem ser 
mantidas e interpretadas. 


Significância geral 

Ao se avaliar a significância estatística do modelo geral, 
diferentes critérios são aplicáveis para procedimentos de 
estimação simultânea versus stepwise. Em ambas as situa- 
ções, os testes estatísticos se relacionam com a habilidade 
das funções discriminantes de obterem escores Z discri- 
minantes que sejam significantemente diferentes entre 
grupos. 


Estimação simultânea. Quando uma abordagem si- 
multânea é usada, as medidas de lambda de Wilks, o 
traço de Hotelling e o critério de Pillai avaliam a sig- 
nificância estatística do poder discriminatório da(s) 
função(ões) discriminante(s). A maior raiz característica 
de Roy avalia apenas a primeira função discriminante. 
Para uma discussão mais detalhada sobre as vantagens e 
desvantagens de cada critério, veja a discussão de testes 
de significância em análise multivariada de variância no 
Capítulo 6. 


Estimação stepwise. Se um método stepwise é empre- 
gado para estimar a função discriminante, as medidas 
D” de Mahalanobis e V de Rao são mais adequadas. 
Ambas são medidas de distância generalizada. O pro- 
cedimento D” de Mahalanobis é baseado em distância 
euclideana quadrada generalizada que se adapta a va- 
riâncias desiguais. A maior vantagem deste procedi- 
mento é que ele é computado no espaço original das 
variáveis preditoras, em vez de ser computado como 
uma versão extraída de outras medidas. O procedimen- 
to D? de Mahalanobis se torna particularmente crítico 
quando o número de variáveis preditoras aumenta por- 
que ele não resulta em redução de dimensionalidade. 
Uma perda em dimensionalidade causaria uma perda 
de informação, porque ela diminui a variabilidade das 
variáveis independentes. Em geral, D” de Mahalanobis 
é o procedimento preferido quando o pesquisador está 
interessado no uso máximo de informação disponível 
em um processo stepwise. 
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Significância de funções discriminantes individuais 
Se o número de grupos é três ou mais, então o pesquisa- 
dor deve decidir não apenas se a discriminação entre gru- 
pos é estatisticamente significante, mas também se cada 
função discriminante estimada é estatisticamente signifi- 
cante. Como discutido anteriormente, a análise discrimi- 
nante estima uma função discriminante a menos do que 
o número de grupos. Se três grupos são analisados, então 
duas funções discriminantes serão estimadas; para quatro 
grupos, três funções serão estimadas, e assim por diante. 
Todos os programas de computador fornecem ao pesqui- 
sador a informação necessária para verificar o número de 
funções necessárias para obter significância estatística, 
sem incluir funções discriminantes que não aumentam o 
poder discriminatório significantemente. 

O critério de significância convencional de 0,05 ou 
acima é frequentemente usado, sendo que alguns pesqui- 
sadores estendem o nível requerido (p.ex., 0,10 ou mais) 
com base na ponderação de custo versus o valor da infor- 
mação. Se os maiores níveis de risco para incluir resulta- 
dos não-significantes (p.ex., níveis de significância > 0,05) 
são aceitáveis, pode-se reter funções discriminantes que 
são significantes no nível 0,2 ou até mesmo 0,3. 

Se uma ou mais funções são consideradas estatistica- 
mente não-significantes, o modelo discriminante deve ser 
reestimado com o número de funções a serem determi- 
nadas limitado ao número de funções significantes. Desse 
modo, a avaliação de precisão preditiva e a interpretação 
das funções discriminantes serão baseadas apenas em fun- 
ções significantes. 


Avaliação do ajuste geral do modelo 


Logo que as funções discriminantes significantes tenham 
sido identificadas, a atenção se desvia para a verificação 
do ajuste geral das funções discriminantes mantidas. Essa 
avaliação envolve três tarefas: 


REGRAS PRÁTICAS 5-2 


Estimação e ajuste do modelo 


e Apesar de a estimação stepwise poder parecer ótima ao 
selecionar o mais parcimonioso conjunto de variáveis 
maximamente discriminantes, cuidado com o impacto 
de multicolinearidade sobre a avaliação do poder 
discriminatório de cada variável. 

O ajuste geral do modelo avalia a significância 
estatística entre grupos sobre os escores Z 
discriminantes, mas não avalia precisão preditiva. 
Tendo mais de dois grupos, não confine sua análise 

a apenas as funções discriminantes estatisticamente 
significantes, mas considere a possibilidade de funções 
não-significantes (com níveis de até 0,3) adicionarem 
poder explanatório. 


1. Calcular escores Z discriminantes para cada observação 
2. Calcular diferenças de grupos nos escores Z discriminantes 
3. Avaliar a precisão de previsão de pertinência a grupos. 


Devemos observar que o emprego da função discri- 
minante para fins de classificação é apenas um entre dois 
possíveis tratamentos. O segundo utiliza uma função de 
classificação, também conhecida como função discrimi- 
nante linear de Fisher. As funções de classificação, uma 
para cada grupo, são usadas exclusivamente para classifi- 
car observações. Nesse método de classificação, os valores 
de uma observação para as variáveis independentes são 
inseridos nas funções de classificação, e um escore de clas- 
sificação para cada grupo é calculado para aquela obser- 
vação. A observação é então classificada no grupo com o 
maior escore de classificação. 

Examinamos a função discriminante como o meio de 
classificação porque ela fornece uma representação conci- 
sa e simples de cada função discriminante, simplificando 
o processo de interpretação e a avaliação da contribuição 
de variáveis independentes. Ambos os métodos conse- 
guem resultados comparáveis, apesar de usarem diferen- 
tes meios. 


Cálculo de escores Z discriminantes 

Com as funções discriminantes retidas definidas, a base 
para calcular os escores Z discriminantes foi estabelecida. 
Como discutido anteriormente, o escore Z discriminante 
de qualquer função discriminante pode ser calculado para 
cada observação pela seguinte fórmula: 


Ze 4 WA WA oo + WA 


J r 


onde 


Z 


= escore Z discriminante da função discriminante 


j para o objeto k 
a =intercepto 
W, = coeficiente discriminante para a variável inde- 
pendente i 
X, = variável independente i para o objeto k 


Este escore, uma variável métrica, fornece uma manei- 
ra direta de comparar observações em cada função. As- 
sume-se que as observações com escores Z semelhantes 
são mais parecidas com base nas variáveis que constituem 
essa função do que aquelas com escores totalmente distin- 
tos. A função discriminante pode ser expressa com pesos 
e valores padronizados ou não-padronizados. A versão 
padronizada é mais útil para fins de interpretação, mas a 
não-padronizada é mais fácil de utilizar no cálculo do es- 
core Z discriminante. 


Avaliação de diferenças de grupos 

Uma vez que os escores Z discriminantes são calculados, 
a primeira avaliação de ajuste geral do modelo é deter- 
minar a magnitude de diferenças entre os membros de 
cada grupo em termos dos escores Z discriminantes. Uma 
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medida resumo das diferenças de grupos é uma compara- 
ção dos centróides dos grupos, o escore Z discriminante 
médio para todos os membros dos grupos. Uma medida 
de sucesso da análise discriminante é sua habilidade em 
definir função(ões) discriminante(s) que resulte(m) em 
centróides de grupos significantemente diferentes. As di- 
ferenças entre centróides são medidas em termos do D” 
de Mahalanobis, para o qual há testes disponíveis para de- 
terminar se as diferenças são estatisticamente significan- 
tes. O pesquisador deve garantir que, mesmo com funções 
discriminantes significantes, há diferenças consideráveis 
entre os grupos. 

Os centróides de grupos em cada função discriminan- 
te também podem ser representados graficamente para 
demonstrar os resultados de uma perspectiva gráfica. 
Gráficos geralmente são preparados para as primeiras 
duas ou três funções discriminantes (assumindo que elas 
são funções estatisticamente significantes). Os valores 
para cada grupo mostram sua posição no espaço discri- 
minante reduzido (assim chamado porque nem todas as 
funções e, assim, nem toda a variância, são representa- 
das graficamente). O pesquisador pode ver as diferenças 
entre os grupos em cada função; no entanto, a inspeção 
visual não explica totalmente o que são essas diferenças. 
Pode-se desenhar círculos que envolvam a distribuição de 
observações em volta de seus respectivos centróides para 
esclarecer melhor as diferenças de grupos, mas esse pro- 
cedimento está além do escopo deste texto (ver Dillon e 
Goldstein [4]). 


Avaliação da precisão preditiva 

de pertinência a grupo 

Dado que a variável dependente é não-métrica, não é pos- 
sível usar uma medida como Rº, como se faz em regressão 
múltipla, para avaliar a precisão preditiva. Em vez disso, 
cada observação deve ser avaliada com o objetivo de sa- 
ber se ela foi corretamente classificada. Ao fazer isso, di- 
versas considerações importantes devem ser feitas: 


e A concepção estatística e prática para desenvolver matrizes 
de classificação 

e A determinação do escore de corte 

e A construção das matrizes de classificação 

e Os padrões para avaliar a precisão de classificação 


Por que matrizes de classificação são desenvolvidas. Os 
testes estatísticos para avaliar a significância das funções 
discriminantes somente avaliam o grau de diferença en- 
tre os grupos com base nos escores Z discriminantes, 
mas não dizem quão bem a função prevê. Esses testes 
estatísticos sofrem das mesmas desvantagens dos testes 
de hipóteses clássicos. Por exemplo, suponha que os dois 
grupos são considerados significantemente diferentes 
além do nível 0,01. Com amostras suficientemente gran- 
des, as médias de grupo (centróides) poderiam ser virtu- 
almente idênticas e ainda teriam significância estatística. 


Para determinar a habilidade preditiva de uma função 
discriminante, o pesquisador deve construir matrizes de 
classificação. 

A matriz de classificação fornece uma perspectiva so- 
bre significância prática, e não sobre significância estatís- 
tica. Com a análise discriminante múltipla, o percentual 
corretamente classificado, também conhecido como razão 
de sucesso, revela o quão bem a função discriminante 
classificou os objetos. Com uma amostra suficientemen- 
te grande em análise discriminante, poderíamos ter uma 
diferença estatisticamente significante entre os dois (ou 
mais) grupos e mesmo assim classificar corretamente 
apenas 53% (quando a chance é de 50%, com grupos de 
mesmo tamanho) [16]. Em tais casos, o teste estatístico 
indicaria significância estatística, ainda que a razão de su- 
cesso viabilizasse um julgamento à parte a ser feito em 
termos de significância prática. Logo, devemos usar o pro- 
cedimento da matriz de classificação para avaliar precisão 
preditiva além de simples significância estatística. 


Cálculo do escore de corte. Usando as funções discrimi- 
nantes consideradas significantes, podemos desenvolver 
matrizes de classificação para uma avaliação mais preci- 
sa do poder discriminatório das funções. Antes que uma 
matriz de classificação seja definida, porém, o pesquisador 
deve determinar o escore de corte (também chamado de 
valor Z crítico) para cada função discriminante. O escore 
de corte é o critério em relação ao qual o escore discrimi- 
nante de cada objeto é comparado para determinar em 
qual grupo o objeto deve ser classificado. 

O escore de corte representa o ponto divisor usado 
para classificar observações em um entre dois grupos ba- 
seado no escore da função discriminante. O cálculo de um 
escore de corte entre dois grupos quaisquer é baseado 
nos centróides de dois grupos (média de grupo dos esco- 
res discriminantes) e no tamanho relativo dos grupos. Os 
centróides são facilmente calculados e fornecidos em cada 
estágio do processo stepwise. Para calcular corretamente 
o escore de corte ótimo, o pesquisador deve abordar dois 
pontos: 


1. Definir as probabilidades a priori, baseado nos tamanhos 
relativos dos grupos observados ou especificados pelo pes- 
quisador (ou assumidos iguais, ou com valores dados pelo 
pesquisador). 

2. Calcular o valor do escore de corte ótimo como uma média 
ponderada sobre os tamanhos assumidos dos grupos (obti- 
do a partir das probabilidades a priori). 


Definição das probabilidades a priori. O impacto 
e a importância de tamanhos relativos de grupos são mui- 
tas vezes desconsiderados, apesar de serem baseados nas 
suposições do pesquisador relativas à representatividade 
da amostra. Neste caso, representatividade se relaciona à 
representação dos tamanhos relativos dos grupos na po- 
pulação real, o que pode ser estabelecido como probabili- 
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dades a priori (ou seja, a proporção relativa de cada grupo 
em relação à amostra total). 

A questão fundamental é: os tamanhos relativos dos 
grupos são representativos dos tamanhos de grupos na 
população? A suposição padrão para a maioria dos pro- 
gramas estatísticos é de probabilidades iguais; em outras 
palavras, cada grupo é considerado como tendo a mesma 
chance de ocorrer, mesmo que os tamanhos dos grupos 
na amostra sejam desiguais. Se o pesquisador está inse- 
guro sobre se as proporções observadas na amostra são 
representativas das proporções da população, a aborda- 
gem conservadora é empregar probabilidades iguais. Em 
alguns casos, estimativas das probabilidades a priori po- 
dem estar disponíveis, como em pesquisa anterior. Aqui a 
suposição padrão de probabilidades iguais a priori é subs- 
tituída por valores especificados pelo pesquisador. Em 
qualquer caso, os reais tamanhos de grupos são substituí- 
dos com base nas probabilidades a priori especificadas. 

No entanto, se a amostra foi conduzida aleatoriamen- 
te e o pesquisador sente que os tamanhos de grupos são 
representativos da população, então o pesquisador pode 
especificar probabilidade a priori com base na amostra 
de estimação. Assim, os verdadeiros tamanhos de gru- 
pos são considerados representativos e diretamente usa- 
dos no cálculo do escore de corte (ver a discussão que 
se segue). Em todos os casos, porém, o pesquisador deve 
especificar como as probabilidades a priori são calcula- 
das, o que afeta os tamanhos de grupos usados no cálculo 
como ilustrado. 


Por exemplo, considere uma amostra de teste consis- 
tindo de 200 observações, com tamanhos de grupos de 
60 a 140 que se relacionam com probabilidades a priori 
de 30% e 70%, respectivamente. Se a amostra é consi- 
derada representativa, então os tamanhos de 60 e 140 
são empregados no cálculo do escore de corte. Não obs- 
tante, se a amostra é considerada não-representativa, o 
pesquisador deve especificar as probabilidades a prio- 
ri. Se elas são especificadas como iguais (50% e 50%), 
os tamanhos amostrais de 100 e 100 seriam usados no 
cálculo do escore de corte no lugar dos tamanhos reais. 
Especificar outros valores para as probabilidades a prio- 
ri resultaria em diferentes tamanhos amostrais para os 
dois grupos. 


Cálculo do escore de corte ótimo. A importância 
das probabilidades a priori no escore de corte é muito evi- 
dente depois que se percebe como o mesmo é calculado. 
A fórmula básica para computar o escore de corte entre 
dois grupos quaisquer é: 


7 -NiZetNZs 
cs 
NAN, 


Zcs = escore de corte ótimo entre grupos A e B 
Ns = número de observações no grupo A 

N, = número de observações no grupo B 

Z, = centróide para o grupo A 

Z, = centróide para o grupo B 


Com tamanhos desiguais de grupos, o escore de cor- 
te ótimo para uma função discriminante é agora a média 
ponderada dos centróides de grupos. O escore de corte 
é ponderado na direção do grupo menor, gerando, com 
sorte, uma melhor classificação do grupo maior. 

Se os grupos são especificados como sendo de iguais 
tamanhos (probabilidades a priori definidas como iguais), 
então o escore de corte ótimo estará a meio caminho en- 
tre os dois centróides e se torna simplesmente a média dos 
mesmos: 


Z,tZs 
e 2 


onde 


Zce = valor do escore de corte crítico para grupos de 
mesmo tamanho 
Z, = centróide do grupo A 
Z, = centróide do grupo B 
Ambas as fórmulas para cálculo do escore de corte óti- 


mo assumem que as distribuições são normais e as estru- 
turas de dispersão de grupos são conhecidas. 


O conceito de um escore de corte ótimo para grupos 
iguais e distintos é ilustrado nas Figuras 5-7 e 5-8, res- 
pectivamente. Os escores de corte ponderados e não- 
ponderados são mostrados. Fica evidente que se o grupo 
A é muito menor que o grupo B, o escore de corte ótimo 
está mais próximo ao centróide do grupo A do que ao 
centróide do grupo B. Além disso, se o escore de corte 
não-ponderado fosse usado, nenhum dos objetos no gru- 
po A seria mal classificado, mas uma parte substancial 
dos que estão no grupo B seria mal classificada. 


Custos de má classificação. O escore de corte ótimo 
também deve considerar o custo de classificar um obje- 
to no grupo errado. Se os custos de má classificação são 
aproximadamente iguais para todos os grupos, o escore 
de corte ótimo será aquele que classificar mal o menor nú- 
mero de objetos em todos os grupos. Se os custos de má 
classificação são desiguais, o escore de corte ótimo será o 
que minimizar os custos de má classificação. Abordagens 
mais sofisticadas para determinar escores de corte são dis- 
cutidas em Dillon e Goldstein [4] e Huberty et al. [13]. 
Essas abordagens são baseadas em um modelo estatístico 
bayesiano e são adequadas quando os custos de má classi- 
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Escore de corte = Ze 


Grupo A 


Classifique como A 
(Não-comprador) 


FIGURA 5-7 Escore de corte ótimo com amostras de tamanhos iguais. 


ficação em certos grupos são altos, quando os grupos são 
de tamanhos muito diferentes, ou quando se deseja tirar 
vantagem de um conhecimento a priori de probabilidades 
de pertinência a grupo. 

Na prática, quando se calcula o escore de corte, ge- 
ralmente não é necessário inserir as medidas originais da 
variável para cada indivíduo na função discriminante e 
obter o escore discriminante para cada pessoa para usar 
no cálculo de Z, e Z, (centróides dos grupos A e B). O 
programa de computador fornece os escores discriminan- 
tes, bem como Z, e Z, como output regular. Quando o 
pesquisador tem os centróides de grupo e os tamanhos da 
amostra, o escore de corte ótimo pode ser obtido simples- 
mente substituindo-se os valores na fórmula apropriada. 


Construção das matrizes de classificação. Para validar a 
função discriminante pelo uso de matrizes de classificação, 
a amostra deve ser aleatoriamente dividida em dois gru- 
pos. Um dos grupos (a amostra de análise) é usado para 
computar a função discriminante. O outro (a amostra de 
teste ou de validação) é retido para uso no desenvolvi- 
mento da matriz de classificação. O procedimento envolve 
a multiplicação dos pesos gerados pela amostra de análise 


Escore de corte 
ótimo ponderado 


Sa 


Grupo A 


Grupo B 


Za 


Classifique como B 


(Comprador) 


pelas medidas originais da variável da amostra de teste. 
Em seguida, os escores discriminantes individuais para a 
amostra de teste são comparados com o valor do escore 
de corte crítico e classificados como se segue: 


Classifique um indivíduo no grupo A se Z, <Z,, 
ou 

Classifique um indivíduo no grupo B se Z, > Za. 
onde 


Z,= escore Z discriminante para o n-ésimo indivíduo 
Z.= valor do escore de corte crítico 


ct 


Os resultados do procedimento de classificação são 
apresentados em forma matricial, como mostrado na Ta- 
bela 5-4. As entradas na diagonal da matriz representam o 
número de indivíduos corretamente classificados. Os nú- 
meros fora da diagonal representam as classificações in- 
corretas. As entradas sob a coluna rotulada de “Tamanho 
do grupo real” representam o número de indivíduos que 
realmente estão em cada um dos dois grupos. As entradas 
na base das colunas representam o número de indivíduos 
designados aos grupos pela função discriminante. O per- 


Escore de corte 
não-ponderado 


Grupo B 


FIGURA 5-8 


Escore de corte ótimo com tamanhos desiguais de amostras. 
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centual corretamente classificado para cada grupo é mos- 
trado no lado direito da matriz, e o percentual geral corre- 
tamente classificado, também conhecido como a razão de 
sucesso, é mostrado na base. 


Em nosso exemplo, o número de indivíduos correta- 
mente designados ao grupo 1 é 22, enquanto 3 mem- 
bros do grupo 1 estão incorretamente designados ao 
grupo 2. Do mesmo modo, o número de classificações 
corretas no grupo 2 é 20, e o número de designações 
incorretas no grupo 1 é 5. Assim, os percentuais de 
precisão de classificação da função discriminante para 
os grupos reais 1 e 2 são 88% e 80%, respectivamente. 
A precisão de classificação geral (razão de sucesso) é 
84%. 


Um tópico final sobre os procedimentos de classifi- 
cação é o teste 1 disponível para determinar o nível de 
significância para a precisão de classificação. A fórmu- 
la para uma análise de dois grupos (igual tamanho de 
amostra) é 


p-0,5 
0,5(1,0- 0,5) 
N 


onde 


p= proporção corretamente classificada 
N= tamanho da amostra 


Essa fórmula pode ser adaptada para uso com mais 
grupos e diferentes tamanhos de amostra. 


Estabelecimento de padrões de comparação para a razão 
de sucesso. Como observado anteriormente, a precisão 
preditiva da função discriminante é medida pela razão 
de sucesso, a qual é obtida a partir da matriz de classi- 
ficação. O pesquisador pode questionar o que é ou não 
considerado um nível aceitável de precisão preditiva para 
uma função discriminante. Por exemplo, 60% é um nível 
aceitável ou deveríamos esperar obter de 80% a 90% de 
precisão preditiva? Para responder essa questão o pesqui- 


sador deve primeiro determinar o percentual que poderia 
ser classificado corretamente por chances (sem a ajuda da 
função discriminante). 


Padrões de comparação para a razão de sucesso em 
grupos de mesmo tamanho. Quando os tamanhos de 
amostra dos grupos são iguais, a determinação da classifi- 
cação por chances é bem simples; ela é obtida dividindo- 
se 1 pelo número de grupos. A fórmula é 


Cieuar = 1/(Número de grupos). 


Por exemplo, para uma função de dois grupos, a pro- 
babilidade seria de 0,50; para uma função de três grupos, 
seria de 0,33, e assim por diante. 


Padrões de comparação para a razão de sucesso em 
grupos de tamanhos desiguais. A determinação da 
classificação por chances para situações nas quais os ta- 
manhos dos grupos são desiguais é um pouco mais com- 
plicada. Devemos considerar apenas o maior grupo, a 
probabilidade combinada de todos os tamanhos de gru- 
pos, ou algum outro padrão? Imaginemos que temos uma 
amostra total de 200 indivíduos divididos como amostras 
de teste e de análise de 100 observações cada. Na amostra 
de teste, 75 objetos pertencem a um grupo e 25 ao outro. 
Examinaremos os possíveis caminhos nos quais podemos 
construir um padrão para comparação e aquilo que cada 
um representa. 


e Conhecido como o critério de chance máxima, poderíamos 
arbitrariamente designar todos os indivíduos ao maior gru- 
po. O critério da chance máxima deve ser usado quando 
o único objetivo da análise discriminante é maximizar o 
percentual corretamente classificado [16]. É também o pa- 
drão mais conservador, pois ele gera o mais alto padrão de 
comparação. No entanto, são raras as situações nas quais 
estamos interessados apenas em maximizar o percentual 
corretamente classificado. Geralmente, o pesquisador usa a 
análise discriminante para identificar corretamente os mem- 
bros de todos os grupos. Em casos nos quais os tamanhos 
das amostras são desiguais e o pesquisador deseja classificar 
os membros de todos os grupos, a função discriminante vai 
contra as chances, classificando um indivíduo no(s) grupo(s) 
menor(es). O critério por chances não leva esse fato em 
consideração [16]. 


TABELA 5-4 Matriz de classificação para análise discriminante de dois grupos 


Grupo previsto 
Tamanho do Percentual correta- 
Grupo real 1 2 grupo real mente classificado 
1 22 3 25 88 
2 5 20 25 80 
Tamanho previsto 
do grupo 27 23 50 84º 


Percentual corretamente classificado = (Número corretamente classificado/Número total de observações) x 100 


= [(22 + 20)/50] x 100 


= 84% 
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Em nosso exemplo simples de uma amostra com dois 
grupos (75 e 25 pessoas cada), usando esse método te- 
ríamos uma precisão de classificação de 75%, o que se 
conseguiria classificando-se todos no grupo maior sem 
a ajuda de qualquer função discriminante. Pode-se con- 
cluir que, a menos que a função discriminante consiga 
uma precisão de classificação maior do que 75%, ela 
deve ser descartada, pois não nos ajuda a melhorar a 
precisão preditiva que podemos atingir sem qualquer 
análise discriminante. 


e Quando os tamanhos de grupos são desiguais e o pesquisa- 
dor deseja identificar corretamente os membros de todos os 
grupos, não apenas do maior, o critério de chances propor- 
cionais é considerado por muitos como o mais apropriado. 
A fórmula para esse critério é 


Cpro — p = py 
onde 


p = proporção de indivíduos no grupo 1 
1-p = proporção de indivíduos no grupo 2 


Usando os tamanhos de grupos de nosso exemplo ante- 
rior (75 e 25), percebemos que o critério de chances pro- 
porcionais seria de 62,5% [0,75” + (1,0 — 0,75) = 0,625] 
comparado com 75%. Logo, neste caso, uma precisão 
preditiva de 75% seria aceitável porque está acima dos 
62,5% do critério de chances proporcionais. 


e Um problema dos critérios de chance máxima e de chances 
proporcionais são os tamanhos das amostras usados para cál- 
culo dos padrões. Você deve usar grupos com o tamanho da 
amostra geral, da amostra de análise/estimação, ou da amos- 
tra de validação/teste? Aqui vão algumas sugestões: 

e Se os tamanhos das amostras de análise e estimação são 
considerados suficientemente grandes (i.e., amostra total 
de 100 com cada grupo tendo pelo menos 20 casos), obte- 
nha padrões separados para cada amostra. 

e Se as amostras separadas não são consideradas suficien- 
temente grandes, use os tamanhos de grupos da amostra 
total para calcular os padrões. 

e Atente a tamanhos de grupos diferentes entre amostras 
quando usar o critério de chance máxima, pois ele depen- 
de do maior tamanho de grupo. Esta orientação é espe- 
cialmente crítica quando a amostra é pequena ou quando 
as proporções de tamanhos de grupos variam muito de 
amostra para amostra. Este é outro motivo de cautela no 
emprego do critério de chance máxima. 


Esses critérios de chances são úteis somente quando 
computados com amostras de teste (abordagem da parti- 
ção da amostra). Se os indivíduos usados no cálculo da fun- 
ção discriminante são os classificados, o resultado é um viés 
ascendente na precisão preditiva. Em tais casos, os critérios 
deveriam ser ajustados para cima em função desse viés. 


Comparação da razão de sucesso com o padrão. A 
questão de “quanta precisão de classificação devo ter?” 
é crucial. Se o percentual de classificações corretas é sig- 
nificantemente maior do que se esperaria por chances, o 
pesquisador pode proceder à interpretação das funções 
discriminantes e de perfis de grupos. No entanto, se a pre- 
cisão de classificação não é maior do que pode ser espera- 
do das chances, quaisquer diferenças que pareçam existir 
merecem pouca ou nenhuma interpretação; ou seja, as 
diferenças em perfis de escores não forneceriam qualquer 
informação significativa para identificar a pertinência a 
grupos. 

A questão, então, é o quanto a precisão de classi- 
ficação deve ser relativa às chances? Por exemplo, se 
as chances são de 50% (dois grupos, com iguais tama- 
nhos), uma precisão de classificação (preditiva) de 60% 
justifica ir para o estágio de interpretação? Em última 
instância, a decisão depende do custo em relação ao va- 
lor da informação. O argumento do custo versus valor 
oferece pouca ajuda ao pesquisador iniciante, mas o 
seguinte critério é sugerido: A precisão de classificação 
deve ser pelo menos um quarto maior do que a obtida 
por chances. 


Por exemplo, se a precisão por chances for de 50%, a 
precisão de classificação deverá ser 62,5% (62,5% = 1,25 
x 50%). Se a precisão de chances for de 30%, a preci- 
são de classificação deverá ser 37,5% (37,5% = 1,25 x 
30%). 


Esse critério fornece apenas uma estimativa grosseira 
do nível aceitável de precisão preditiva. O critério é fácil 
de aplicar com grupos de mesmo tamanho. Com grupos de 
tamanhos desiguais, um limite superior é alcançado quan- 
do o modelo de chance máxima é usado para determinar 
a precisão de chances. No entanto, isso não representa um 
grande problema, pois sob a maioria das circunstâncias o 
modelo de chance máxima não seria usado com grupos de 
tamanhos distintos. 


Razões de sucesso geral versus específicas de gru- 
pos. Até este ponto, nos concentramos no cálculo da 
razão de sucesso geral em todos os grupos avaliando a 
precisão preditiva de uma análise discriminante. O pes- 
quisador também deve estar preocupado com a razão de 
sucesso (percentual corretamente classificado) para cada 
grupo separado. Se você se concentrar somente na razão 
de sucesso geral, é possível que um ou mais grupos, par- 
ticularmente os menores, possam ter razões de sucesso 
inaceitáveis enquanto a razão de sucesso geral é aceitá- 
vel. O pesquisador deve calcular a razão de sucesso de 
cada grupo e avaliar se a análise discriminante fornece 
níveis adequados de precisão preditiva tanto no nível ge- 
ral quanto para cada grupo. 
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Medidas com base estatística de precisão de classificação 
relacionada a chances* Um teste estatístico do poder 
discriminatório da matriz de classificação quando com- 
parada com um modelo de chances é a estatística Q de 
Press. Essa medida simples compara o número de clas- 
sificações corretas com o tamanho da amostra total e o 
número de grupos. O valor calculado é então comparado 
com um valor crítico (o valor qui-quadrado para um grau 
de liberdade no nível de confiança desejado). Se ele exce- 
de este valor crítico, então a matriz de classificação pode 
ser considerada estatisticamente melhor do que as chan- 


ces. A estatística O é calculada pela seguinte fórmula: 
a 2 
dare BEL 
N(K-1) 


onde 


N= tamanho da amostra total 

n= número de observações corretamente classifica- 
das 

K= número de grupos 


Por exemplo, na Tabela 5-4, a estatística O seria baseada 
em uma amostra total de N = 50, n = 42 observações cor- 
retamente classificadas, e K = 2 grupos. A estatística cal- 
culada seria: 


[50-(42x2)P 
50(2-1) 


O de Press = = 23,12 


O valor crítico em um nível de significância de 0,01 é 
6,63. Assim, concluiríamos que, no exemplo, as previsões 
seriam significantemente melhores do que chances, as 
quais teriam uma taxa de classificação correta de 50%. 


Esse teste simples é sensível ao tamanho da amostra; 
amostras grandes são mais prováveis de mostrar signifi- 
cância do que amostras pequenas da mesma taxa de clas- 
sificação. 


Por exemplo, se o tamanho da amostra é aumentado para 
100 no exemplo e a taxa de classificação permanece em 
84%, a estatística Q aumenta para 46,24. Se o tamanho 
da amostra sobe para 200, mas mantém a taxa de classifi- 
cação em 84%, a estatística O novamente aumenta para 
92,48%. Mas se a amostra for apenas 20 e a taxa de classi- 
ficação incorreta** for ainda de 84% (17 previsões corre- 
tas), a estatística O seria de somente 9,8. Ou seja, examine 
a estatística O à luz do tamanho amostral, pois aumentos 
no tamanho da amostra fazem subir a estatística O ainda 
que seja para a mesma taxa de classificação geral. 


* N. de R. T.: A palavra “chance” também poderia ser traduzida como 
“acaso”. 
** N. de R. T.: A frase correta seria “taxa de classificação correta”. 


Porém, é necessário cuidado nas conclusões baseadas 
apenas nessa estatística, pois à medida que a amostra fica 
maior, uma taxa de classificação menor ainda será consi- 
derada significante. 


Diagnóstico por casos 


O meio final de avaliar o ajuste de modelo é examinar os 
resultados preditivos em uma base de casos. Semelhante 
à análise de resíduos em regressão múltipla, o objetivo é 
entender quais observações (1) foram mal classificadas e 
(2) não são representativas dos demais membros do gru- 
po. Apesar de a matriz de classificação fornecer precisão 
de classificação geral, ela não detalha os resultados indi- 
viduais. Além disso, mesmo que possamos denotar quais 
casos são correta ou incorretamente classificados, ainda 
precisamos de uma medida da similaridade de uma obser- 
vação com o restante do grupo. 


Má classificação de casos individuais 

Quando se analisam resíduos de uma análise de regressão 
múltipla, uma decisão importante envolve estabelecer o 
nível de resíduo considerado substancial e merecedor de 
atenção. Em análise discriminante, essa questão é mais 
simples, porque uma observação é ou correta, ou incorre- 
tamente classificada. Todos os programas de computador 
fornecem informação que identifica quais casos são mal 
classificados e para quais grupos eles foram mal classifi- 
cados. O pesquisador pode identificar não apenas aqueles 
casos com erros de classificação, mas uma representação 
direta do tipo de má classificação. 


Análise de casos mal classificados 

O propósito de identificar e analisar as observações mal 
classificadas é identificar quaisquer características dessas 
observações que pudessem ser incorporadas à análise dis- 
criminante para melhorar a precisão preditiva. Essa análi- 
se pode assumir a forma de se estabelecer o perfil de casos 
mal classificados tanto nas variáveis independentes quan- 
to em outras variáveis não incluídas no modelo. 


O perfil das variáveis independentes. Examinar esses 
casos nas variáveis independentes pode identificar ten- 
dências não-lineares ou outras relações ou atributos que 
conduziram à má classificação. Várias técnicas são parti- 
cularmente adequadas em análise discriminante: 


e Uma representação gráfica das observações é talvez a abor- 
dagem mais simples e efetiva para examinar as caracterís- 
ticas de observações, especialmente as mal classificadas. A 
abordagem mais comum é fazer o gráfico das observações 
com base em seus escores Z discriminantes e mostrar a so- 
breposição entre grupos e os casos mal classificados. Se duas 
ou mais funções são mantidas, os pontos de corte ótimo 
também podem ser representados graficamente para forne- 
cer aquilo que é conhecido como um mapa territorial, que 
exibe as regiões correspondentes para cada grupo. 
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e Representar graficamente as observações individuais com 
os centróides dos grupos, como anteriormente discutido, 
mostra não apenas as características gerais dos grupos via 
centróides, mas também a variação nos membros nos gru- 
pos. Isso é análogo às áreas definidas no exemplo de três 
grupos no começo deste capítulo, em que escores de cor- 
te em ambas as funções definiam áreas correspondentes às 
previsões de classificação para cada grupo. 

e Uma avaliação empírica direta da similaridade de uma ob- 
servação com os membros do outro grupo pode ser feita 
calculando-se a distância D? de Mahalanobis da observação 
ao centróide do grupo. Com base no conjunto de variáveis 
independentes, observações mais próximas ao centróide 
têm um D? de Mahalanobis menor e são consideradas mais 
representativas do grupo do que as mais afastadas. 

e Noentanto, a medida empírica deve ser combinada com uma 
análise gráfica, pois apesar de um grande Dº de Mahalanobis 
indicar observações que são bastante diferentes dos centrói- 
des de grupo, isso nem sempre indica má classificação. Por 
exemplo, em uma situação de dois grupos, um membro do 
grupo A pode ter uma grande distância D? de Mahalanobis, 
indicando que ele é menos representativo do grupo. Contu- 
do, se essa distância está afastada do centróide do grupo B, 
então realmente aumentam as chances de classificação corre- 
ta, mesmo que ele seja menos representativo do grupo. Uma 
menor distância que coloca uma observação entre os dois 
centróides provavelmente teria uma menor probabilidade 
de classificação correta, mesmo que ela esteja mais próxima 
ao centróide de seu grupo do que na situação anterior. 


Apesar de não existir qualquer análise pré-especifi- 
cada, como na regressão múltipla, o pesquisador é enco- 
rajado a avaliar esses casos mal classificados de diversos 
pontos de vista, na tentativa de descobrir as caracterís- 
ticas únicas que eles têm em comparação com os outros 
membros do seu grupo. 


Perfil de variáveis não presentes na análise. O exame de 
outras variáveis quanto às suas diferenças nos casos mal 
classificados seria o primeiro passo para sua possível in- 
clusão na análise discriminante. Muitas vezes, variáveis 
que discriminam apenas em um conjunto menor de casos 
não são identificadas no primeiro conjunto de análises, 
mas se tornam mais evidentes na análise de casos mal 
classificados. O pesquisador é encorajado a rever as áreas 
de suporte conceitual para identificar novas possíveis va- 
riáveis que possam se relacionar unicamente com os casos 
mal classificados e aumentar a precisão preditiva geral. 


Resumo 


O estágio de estimação e avaliação tem várias semelhan- 
ças com as outras técnicas de dependência, permitindo um 
processo de estimação direta ou stepwise e uma análise da 
precisão preditiva geral e de casos. O pesquisador deve de- 
dicar considerável atenção a essas questões para evitar o 
uso de um modelo de análise discriminante fundamental- 
mente errado. 


REGRAS PRÁTICAS 5-3 


Avaliação do ajuste de modelo e precisão preditiva 


e A matriz de classificação e a razão de sucesso 
substituem R” como a medida de ajuste de modelo: 

e Avalie a razão de sucesso geral e por grupo 

e Se as amostras de estimação e análise excederem 100 
casos e cada grupo exceder 20 casos, derive padrões 
separados para cada amostra; caso contrário, derive 
um único padrão a partir da amostra geral 

Critérios múltiplos são usados para comparação com a 

razão de sucesso: 

e Ocritério de chance máxima para avaliação da 
razão de sucesso é o mais conservador, dando a mais 
elevada base para exceder 
Seja cuidadoso no uso do critério de chance máxima 
em situações com amostras gerais menores que 100 
e/ou grupos com menos de 20 
O critério de chance proporcional considera 
todos os grupos no estabelecimento do padrão de 
comparação e é o mais popular 
A verdadeira precisão preditiva (razão de sucesso) 
deve exceder qualquer valor de critério em pelo 
menos 25% 

Analise as observações mal classificadas gráfica (mapa 

territorial) e empiricamente (D” de Mahalanobis) 


ESTÁGIO 5: INTERPRETAÇÃO 
DOS RESULTADOS 


Se a função discriminante é estatisticamente significante e 
a precisão de classificação é aceitável, o pesquisador deve 
se concentrar em fazer interpretações substanciais das 
descobertas. Esse processo envolve o exame das funções 
discriminantes para determinar a importância relativa de 
cada variável independente na discriminação entre os gru- 
pos. Três métodos para determinar a importância relativa 
foram propostos: 


1. Pesos discriminantes padronizados 
2. Cargas discriminantes (correlações de estrutura) 
3. Valores F parciais 


Pesos discriminantes 


A abordagem tradicional para interpretar funções dis- 
criminantes examina o sinal e a magnitude do peso 
discriminante padronizado (às vezes chamado de coefi- 
ciente discriminante) designado para cada variável ao se 
computarem as funções discriminantes. Quando o sinal 
é ignorado, cada peso representa a contribuição relativa 
de sua variável associada âquela função. As variáveis 
independentes com pesos relativamente maiores con- 
tribuem mais para o poder discriminatório da função 
do que as variáveis com pesos menores. O sinal indica 
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apenas que a variável tem uma contribuição positiva ou 
negativa [4]. 

A interpretação de pesos discriminantes é análoga 
à interpretação de pesos beta em análise de regressão e 
está, portanto, sujeita às mesmas críticas. Por exemplo, 
um peso pequeno pode indicar que sua variável corres- 
pondente é irrelevante na determinação de uma relação, 
ou que ela tenha sido deixada de lado na relação por cau- 
sa de um elevado grau de multicolinearidade. Um outro 
problema do uso de pesos discriminantes é que eles es- 
tão sujeitos a considerável instabilidade. Esses problemas 
sugerem cuidado ao se usarem pesos para interpretar os 
resultados da análise discriminante. 


Cargas discriminantes 


As cargas discriminantes, às vezes chamadas de correla- 
ções de estrutura, são cada vez mais usadas como uma 
base para interpretação, por conta das deficiências na utili- 
zação de pesos. Medindo a correlação linear simples entre 
cada variável independente e a função discriminante, as 
cargas discriminantes refletem a variância que as variáveis 
independentes compartilham com a função discriminan- 
te. Em relação a isso, elas podem ser interpretadas como 
cargas fatoriais na avaliação da contribuição relativa de 
cada variável independente para a função discriminante. 
(O Capítulo 3 discute melhor a interpretação de cargas 
fatoriais.) 

Uma característica ímpar de cargas é que elas podem 
ser calculadas para todas as variáveis, sejam elas usadas na 
estimação da função discriminante ou não. Este aspecto 
é particularmente útil quando um processo de estimação 
stepwise é empregado e algumas variáveis não são incluí- 
das na função discriminante. Em vez de não se ter forma 
alguma de compreender seu impacto relativo, as cargas 
fornecem um efeito relativo de cada variável em uma me- 
dida comum. 

Com as cargas, a questão principal é: Quais valores as 
cargas devem assumir para serem consideradas substan- 
tivas discriminadoras dignas de nota? Tanto em análise 
discriminante simultânea quanto stepwise, variáveis que 
exibem uma carga de + 0,40 ou mais são consideradas 
substantivas. Com procedimentos stepwise, tal determi- 
nação é suplementada, pois a técnica evita que variáveis 
não-significantes entrem na função. Porém, multicoline- 
aridade e outros fatores podem evitar uma variável na 
equação, o que não significa necessariamente que ela não 
tenha um efeito substancial. 

As cargas discriminantes (assim como os pesos) podem 
estar sujeitas à instabilidade. As cargas são consideradas 
relativamente mais válidas do que os pesos como um meio 
de interpretação do poder discriminatório de variáveis in- 
dependentes por causa de sua natureza correlacional. O 
pesquisador ainda deve ser cuidadoso ao usar cargas para 
interpretar funções discriminantes. 


Valores F parciais 


Como anteriormente discutido, duas abordagens compu- 
tacionais — simultânea e stepwise — podem ser utilizadas 
para determinar funções discriminantes. Quando o mé- 
todo stepwise é selecionado, um meio adicional de inter- 
pretar o poder discriminatório relativo das variáveis inde- 
pendentes está disponível pelo uso de valores F parciais. 
Isso é obtido examinando-se os tamanhos absolutos dos 
valores F significantes e ordenando-os. Valores F grandes 
indicam maior poder discriminatório. Na prática, as or- 
denações que usam a abordagem dos valores F são iguais 
à ordenação determinada a partir do uso de pesos discri- 
minantes, mas os valores F indicam o nível associado de 
significância para cada variável. 


Interpretação de duas ou mais funções 


Quando há duas ou mais funções discriminantes signi- 
ficantes, temos problemas adicionais de interpretação. 
Primeiro, podemos simplificar os pesos ou cargas discri- 
minantes para facilitar a determinação do perfil de cada 
função? Segundo, como representamos o impacto de cada 
variável nas funções? Esses problemas ocorrem tanto na 
medida dos efeitos discriminantes totais das funções quan- 
to na avaliação do papel de cada variável no perfil de cada 
função separadamente. Tratamos dessas duas questões 
introduzindo os conceitos de rotação das funções, o índice 
de potência, e representações de vetores expandidos. 


Rotação das funções discriminantes 

Depois que as funções discriminantes foram desenvolvi- 
das, elas podem ser rotacionadas para redistribuir a va- 
riância. (O conceito é melhor explicado no Capítulo 3.) 
Basicamente, a rotação preserva a estrutura original e a 
confiabilidade da solução discriminante, ao passo que tor- 
na as funções muito mais fáceis de interpretar. Na maio- 
ria dos casos, a rotação VARIMAX é empregada como a 
base para a rotação. 


Índice de potência 

Anteriormente discutimos o uso de pesos padronizados ou 
cargas discriminantes como medidas da contribuição de 
uma variável a uma função discriminante. Quando duas 
ou mais funções são determinadas, contudo, uma medida 
resumo ou composta é útil para descrever as contribuições 
de uma variável em todas as funções significantes. O índice 
de potência é uma medida relativa entre todas as variáveis 
que é indicativa do poder discriminante de cada variável 
[18]. Ele inclui a contribuição de uma variável a uma fun- 
ção discriminante (sua carga discriminante) e a contribui- 
ção relativa da função para a solução geral (uma medida 
relativa entre as funções com base nos autovalores). A 
composição é simplesmente a soma dos índices de potência 
individuais em todas as funções discriminantes significan- 
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tes. A interpretação da medida composta é limitada, contu- 
do, pelo fato de que é útil apenas na representação da po- 
sição relativa (como o oposto de uma ordenação) de cada 
variável, e o valor absoluto não tem qualquer significado 
real. O índice de potência é calculado por um processo de 
dois passos: 


Passo 1: Calcular um valor de potência para cada função sig- 
nificante. No primeiro passo, o poder discriminatório 
de uma variável, representado pelo quadrado da carga 
discriminante não-rotacionada, é “ponderado” pela 
contribuição relativa da função discriminante para a 
solução geral. Primeiro, a medida do autovalor relativo 
para cada função discriminante significante é calculada 
simplesmente como: 


Autovalor da função 


Autovalor relativo discriminante j 


da função = 
discriminante j Soma de autovalores em todas as 
funções significantes 


O valor potência de cada variável em uma função dis- 
criminante é então: 
Valor potência 


da variável i = 
na função j 


(Carga discriminante,, Px 
Autovalor relativo da função j 


Passo 2: Calcular um índice de potência composto em todas as 
funções significantes. Uma vez que um valor potência 
tenha sido calculado para cada função, o índice de po- 
tência composto para cada variável é calculado como: 


Soma dos valores de 

potência da variável 1 em 
todas as funções discriminantes 
significantes 


Potência composta 
da variável 1 = 


O índice de potência agora representa o efeito discrimi- 
nante total da variável em todas as funções discriminantes 
significantes. É apenas uma medida relativa, contudo, e seu 
valor absoluto não tem qualquer significado importante. 
Uma ilustração de cálculo de índice de potência é forneci- 
da no exemplo para análise discriminante de três grupos. 


Disposição gráfica de escores e 

cargas discriminantes 

Para representar diferenças nos grupos nas variáveis 
preditoras, o pesquisador pode usar dois diferentes tra- 
tamentos para representação gráfica. O mapa territorial 
representa graficamente os casos individuais de funções 
discriminantes significantes para permitir ao pesquisador 
uma avaliação da posição relativa de cada observação 
com base nos escores da função discriminante. A segunda 
abordagem é representar graficamente as cargas discrimi- 
nantes para entender o agrupamento relativo e a magnitu- 
de de cada carga sobre cada função. Cada abordagem será 
discutida detalhadamente na próxima seção. 


Mapa territorial. O método gráfico mais comum é o 
mapa territorial, no qual cada observação é impressa em 


um gráfico com base nos escores Z da função discrimi- 
nante das observações. Por exemplo, considere que uma 
análise discriminante de três grupos tem duas funções 
discriminantes significantes. Um mapa territorial é criado 
fazendo-se o gráfico dos escores Z discriminantes de cada 
observação para a primeira função discriminante sobre o 
eixo X e os escores para a segunda função discriminante 
sobre o eixo Y. Desse modo, isso fornece diversas pers- 
pectivas de análise: 


e O gráfico dos membros de cada grupo com diferentes sím- 
bolos permite um retrato fácil das diferenças de cada grupo, 
bem como suas sobreposições um com o outro. 

e O gráfico dos centróides de cada grupo fornece uma manei- 
ra de avaliar cada membro de grupo relativamente ao seu 
centróide. Este procedimento é particularmente útil na ava- 
liação da possibilidade de grandes medidas de Mahalanobis 
D” conduzirem a classificações ruins. 

e Retas representando os escores de corte também podem ser 
graficamente representadas, denotando fronteiras que re- 
presentam os intervalos de escores discriminantes previstos 
em cada grupo. Quaisquer membros de grupos que estejam 
fora dessas fronteiras são mal classificados. Denotar os casos 
mal classificados permite uma avaliação sobre qual função 
discriminante foi mais responsável pela má classificação, e 
sobre o grau em que um caso é mal classificado. 


Gráfico vetorial de cargas discriminantes. A abordagem 
gráfica mais simples é representar cargas reais rotaciona- 
das ou não-rotacionadas. A abordagem preferencial seria 
com cargas rotacionadas. Semelhante ao gráfico de cargas 
fatoriais (ver Capítulo 3), este método representa o grau 
em que cada variável é associada com cada função discri- 
minante. 

Uma técnica ainda mais precisa, porém, envolve o 
gráfico de cargas bem como vetores para cada carga e 
centróide de grupo. Um vetor é meramente uma reta de- 
senhada a partir da origem (centro) de um gráfico até as 
coordenadas das cargas de uma variável particular ou um 
centróide de grupo. Com a representação de um vetor ex- 
pandido, o comprimento de cada vetor se torna indicativo 
da importância relativa de cada variável na discriminação 
entre os grupos. O procedimento gráfico segue em três 
passos: 


1. Seleção de variáveis: Todas as variáveis, sejam incluídas 
no modelo ou não, podem ser graficamente representadas 
como vetores. Desse modo, a importância de variáveis co- 
lineares que não estão incluídas, como em stepwise, ainda 
pode ser retratada. 

2. Expansão de vetores: As cargas discriminantes de cada va- 
riável são expandidas multiplicando-se a carga discriminan- 
te (preferencialmente após a rotação) por seu respectivo va- 
lor F univariado. Notamos que os vetores apontam para os 
grupos com a maior média sobre o preditor respectivo e na 
direção oposta dos grupos com os menores escores médios. 

3. Gráfico dos centróides de grupos: Os centróides de grupo 
também são expandidos nesse procedimento, sendo multi- 
plicados pelo valor F aproximado associado a cada função 
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discriminante. Se as cargas são expandidas, os centróides 
também devem ser expandidos para representá-los com 
precisão no mesmo gráfico. Os valores F aproximados para 
cada função discriminante são obtidos pela seguinte fór- 


mula: 
N no 
Valor E uacE Autovalor ao Amostra de estimação 
o ' NG -1 
onde 
N amostra de estimação = tamanho da amostra de estimação 


Por exemplo, considere que a amostra de 50 observações 
tenha sido dividida em três grupos. O multiplicador de 
cada autovalor seria (50 -3)/(3- 1) = 23,5. 


Quando completado, o pesquisador dispõe de um re- 
trato do agrupamento de variáveis em cada função dis- 
criminante, a magnitude da importância de cada variável 
(representada pelo comprimento de cada vetor) e o perfil 
de cada centróide de grupo (mostrado pela proximidade 
de cada vetor). Apesar de este procedimento dever ser 
feito manualmente na maioria dos casos, ele dá um retra- 
to completo das cargas discriminantes e dos centróides de 
grupos. Para mais detalhes sobre esse procedimento, ver 
Dillon e Goldstein [4]. 


Qual método interpretativo usar? 


Diversos métodos para interpretar a natureza das funções 
discriminantes foram discutidos, tanto para soluções de 
uma função quanto de múltiplas. Quais métodos devem 
ser usados? A abordagem das cargas é mais válida do que 
o emprego de pesos e deve ser utilizada sempre que pos- 
sível. O uso de valores F parciais e univariados permite 
ao pesquisador empregar diversas medidas e procurar 
alguma consistência nas avaliações das variáveis. Se duas 
ou mais funções são estimadas, então o pesquisador pode 
utilizar diversas técnicas gráficas e o índice de potência, 
que ajuda na interpretação da solução multidimensional. 
O ponto mais básico é que o pesquisador deve usar todos 
os métodos disponíveis para chegar à interpretação mais 
precisa. 


ESTÁGIO 6: VALIDAÇÃO 
DOS RESULTADOS 


O estágio final de uma análise discriminante envolve a 
validação dos resultados discriminantes para garantir que 
os resultados têm validade externa e interna. Com a pro- 
pensão da análise discriminante para aumentar a razão de 
sucesso se avaliada apenas sobre a amostra de análise, a 
validação é um passo essencial. Além de validar as razões 


de sucesso, o pesquisador deve usar o perfil de grupos 
para garantir que as médias de grupos sejam indicadores 
válidos do modelo conceitual usado na seleção de variá- 
veis independentes. 


Procedimentos de validação 


Validação é um passo crítico em qualquer análise discri- 
minante, pois muitas vezes, especialmente com amostras 
menores, os resultados podem carecer de generalidade 
(validade externa). A técnica mais comum para estabe- 
lecer validade externa é a avaliação de razões de suces- 
so. Validação pode ocorrer com uma amostra separada 
(amostra de teste) ou utilizando-se um procedimento que 
repetidamente processa a amostra de estimação. Validade 
externa é admitida quando a razão de sucesso da aborda- 
gem selecionada excede os padrões de comparação que 
representam a precisão preditiva esperada pelo acaso (ver 
discussão anterior). 


Utilização de uma amostra de teste 

Geralmente, a validação das razões de sucesso é execu- 
tada criando-se uma amostra de teste, também chamada 
de amostra de validação. O propósito de se utilizar uma 
amostra de teste para fins de validação é ver o quão bem 
a função discriminante funciona em uma amostra de ob- 
servações não usadas para obter a mesma. Este processo 
envolve o desenvolvimento de uma função discriminante 
com a amostra de análise e então a sua aplicação na amos- 
tra de teste. A justificativa para dividir a amostra total em 
dois grupos é que um viés ascendente ocorrerá na precisão 
preditiva da função discriminante se os indivíduos usados 
no desenvolvimento da matriz de classificação forem os 
mesmos utilizados para computar a função; ou seja, a pre- 
cisão de classificação será mais alta do que é válido se ela 
for aplicada na amostra de estimação. 

Outros pesquisadores têm sugerido que uma confiança 
maior ainda poderia ser depositada na validade da função 
discriminante seguindo-se esse procedimento diversas ve- 
zes [18]. Ao invés de dividir aleatoriamente a amostra to- 
tal em grupos de análise e de teste uma vez, o pesquisador 
dividiria aleatoriamente a amostra total em amostras de 
análise e de teste várias vezes, sempre testando a valida- 
de da função discriminante pelo desenvolvimento de uma 
matriz de classificação e de uma razão de sucesso. Então 
as diversas razões de sucesso teriam uma média para se 
obter uma única medida. 


Validação cruzada 

A técnica de validação cruzada para avaliar validade ex- 
terna é feita com múltiplos subconjuntos da amostra total 
[2,4]. A abordagem mais amplamente usada é o método 
jackknife. Validação cruzada é baseada no princípio do 
“deixe um de fora”. O uso mais comum desse método é 
estimar k — 1 amostras, eliminando-se uma observação 
por vez a partir de uma amostra de k casos. Uma fun- 
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ção discriminante é calculada para cada subamostra, e 
em seguida a pertinência a grupo prevista da observação 
eliminada é feita com a função discriminante estimada 
sobre os demais casos. Depois que todas as previsões de 
pertinência a grupo foram feitas, uma por vez, uma ma- 
triz de classificação é construída e a razão de sucesso é 
calculada. 

Validação cruzada é muito sensível a amostras pe- 
quenas. Orientações sugerem que ela seja usada somente 
quando o tamanho do grupo menor é pelo menos três ve- 
zes o número de variáveis preditoras, e a maioria dos pes- 
quisadores sugere uma proporção de cinco para um [13]. 
No entanto, validação cruzada pode representar a única 
técnica de validação possível em casos em que a amos- 
tra original é muito pequena para dividir em amostras de 
análise e de teste, mas ainda excede as orientações já dis- 
cutidas. Validação cruzada também está se tornando mais 
amplamente usada à medida que os principais programas 
de computador a disponibilizam como opção. 


Diferenças de perfis de grupos 


Uma outra técnica de validação é estabelecer o perfil dos 
grupos sobre as variáveis independentes para garantir 
sua correspondência com as bases conceituais usadas na 
formulação do modelo original. Depois que o pesquisa- 
dor identifica as variáveis independentes que oferecem 
a maior contribuição à discriminação entre os grupos, o 
próximo passo é traçar o perfil das características dos gru- 
pos com base nas médias dos mesmos. Esse perfil permite 
ao pesquisador compreender o caráter de cada grupo de 
acordo com as variáveis preditoras. 


REGRAS PRÁTICAS 5-4 


Interpretação e validação de funções 
discriminantes 


Cargas discriminantes são o método preferido para 
avaliar a contribuição de cada variável em uma função 
discriminante, pois elas são: 
Uma medida padronizada de importância (variando 
de0a1) 
Disponíveis para todas as variáveis independentes, 
sejam usadas no processo de estimação ou não 
Não afetadas por multicolinearidade 
Cargas excedendo + 0,40 são consideradas substantivas 
para fins de interpretação 
No caso de mais de uma função discriminante, 
certifique-se de: 
e Usar cargas rotacionadas 
e Avaliar a contribuição de cada variável em todas as 
funções com o índice de potência 
A função discriminante deve ser validada com a 
amostra de teste ou um dos procedimentos “deixe um 
de fora” 


Por exemplo, olhando os dados da pesquisa da Kitchen- 
Aid apresentados na Tabela 5-1, percebemos que a ava- 
liação média de “durabilidade” para o grupo “compra- 
ria” é 7,4, enquanto a avaliação média comparável de 
“durabilidade” para o grupo “não compraria” é de 3,2. 
Assim, um perfil desses dois grupos mostra que o grupo 
“compraria” avalia a durabilidade percebida do novo 
produto bem mais do que o grupo “não compraria”. 


Outra abordagem é estabelecer o perfil de grupos em 
um conjunto separado de variáveis que deve espelhar as 
diferenças observadas de grupos. Esse perfil separado for- 
nece uma avaliação de validade externa, de modo que os 
grupos variam tanto na(s) variável(eis) independente(s) 
quanto no conjunto de variáveis associadas. Essa técnica 
é semelhante, em caráter, à validação de agrupamentos 
obtidos descrita no Capítulo 8. 


UM EXEMPLO ILUSTRATIVO 
DE DOIS GRUPOS 


Para ilustrar a aplicação da análise discriminante de dois 
grupos, usamos variáveis obtidas da base de dados HBAT 
introduzida no Capítulo 1. Esse exemplo examina cada 
um dos seis estágios do processo de construção de modelo 
para um problema de pesquisa particularmente adequado 
à análise discriminante múltipla. 


Estágio 1: Objetivos da análise discriminante 


Você lembra que uma das características de cliente obti- 
da pela HBAT em sua pesquisa foi uma variável categó- 
rica (X,) que indicava a região na qual a empresa estava 
localizada: EUA/América do Norte ou fora. A equipe 
administrativa da HBAT está interessada em quaisquer 
diferenças de percepções entre aqueles clientes localiza- 
dos e servidos por sua equipe de venda nos EUA versus 
aqueles fora dos EUA e que são servidos principalmente 
por distribuidores independentes. A despeito de diferen- 
ças encontradas em termos de suporte de vendas devido 
à natureza da equipe de venda servindo cada área geo- 
gráfica, a equipe administrativa está interessada em ver 
se as outras áreas de operação (linha do produto, preço 
etc.) são vistas de maneira distinta por estes dois con- 
juntos de clientes. Esta indagação segue a óbvia neces- 
sidade por parte da administração de sempre procurar 
melhor entender seu cliente, neste caso se concentrando 
em diferenças que podem ocorrer entre áreas geográfi- 
cas. Se quaisquer percepções de HBAT forem notadas 
como diferindo significativamente entre firmas nessas 
duas regiões, a companhia será então capaz de desen- 
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volver estratégias para remediar quaisquer deficiências 
percebidas e desenvolver estratégias diferenciadas para 
acomodar as percepções distintas. 


Para tanto, a análise discriminante foi selecionada para 
identificar aquelas percepções da HBAT que melhor dife- 
renciam as empresas em cada região geográfica. 


Estágio 2: Projeto de pesquisa 
para análise discriminante 


O estágio de projeto de pesquisa se concentra em três ques- 
tões-chave: selecionar variáveis dependente e independen- 
tes, avaliar a adequação do tamanho da amostra para a aná- 
lise planejada, e dividir a amostra para fins de validação. 


Seleção de variáveis dependente e independentes 

A análise discriminante requer uma única medida depen- 
dente não-métrica e uma ou mais medidas independentes 
métricas que são afetadas para fornecer diferenciação en- 
tre os grupos baseados na medida dependente. 


Como a variável dependente Região (X,) é uma variá- 
vel categórica de dois grupos, a análise discriminante é a 
técnica apropriada. O levantamento coletou percepções 
da HBAT que agora podem ser usadas para distinguir 
entre os dois grupos de firmas. A análise discriminante 
usa como variáveis independentes as 13 variáveis de per- 
cepção a partir do banco de dados (X, a X,,) para discri- 
minar entre firmas em cada área geográfica. 


Tamanho da amostra 

Dado o tamanho relativamente pequeno da amostra 
HBAT (100 observações), questões como tamanho amos- 
tral são particularmente importantes, especialmente a di- 
visão da amostra em amostras de teste e de análise (ver 
discussão na próxima seção). 


A amostra de 100 observações, quando particionada em 
amostras de análise e de teste de 60 e 40 respectivamente, 
mal atende à proporção mínima de 5 para 1 de observa- 
ções para variáveis independentes (60 observações para 
13 variáveis independentes em potencial) sugerida para 
a amostra de análise. Apesar de essa proporção crescer 
para quase 8 para 1 se a amostra não for dividida, consi- 
dera-se mais importante validar os resultados do que au- 
mentar o número de observações na amostra de análise. 
Os dois grupos de 26 e 34 na amostra de estimação 
também excedem o tamanho mínimo de 20 observações 
por grupo. Finalmente, os dois grupos são suficientemen- 
te comparáveis em tamanho para não impactar adversa- 
mente os processos de estimação ou de classificação. 


Divisão da amostra 

A discussão anterior enfatizou a necessidade de validar 
a função discriminante dividindo a amostra em duas par- 
tes, uma usada para estimação e a outra para validação. 
Em qualquer momento em que uma amostra de teste é 
empregada, o pesquisador deve garantir que os tamanhos 
de amostra resultantes sejam suficientes para embasar o 
número de preditores incluídos na análise. 


A base de dados HBAT tem 100 observações; foi deci- 
dido que uma amostra de teste de 40 observações seria 
suficiente para fins de validação. Essa partição deixaria 
ainda 60 observações para a estimação da função discri- 
minante. Além disso, os tamanhos relativos de grupos na 
amostra de estimação (26 e 34 nos dois grupos) permiti- 
riam a estimação sem complicações devidas a diferenças 
consideráveis de tamanhos de grupos. 


É importante garantir aleatoriedade na seleção da 
amostra de validação, de modo que qualquer ordenação 
das observações não afete os processos de estimação e de 
validação. 


Estágio 3: Suposições da análise discriminante 
As principais suposições inerentes à análise discrimi- 
nante envolvem a formação da variável estatística ou 
função discriminante (normalidade, linearidade e mul- 
ticolinearidade) e a estimação da função discriminan- 
te (matrizes de variância e covariância iguais). Como 
examinar as variáveis independentes quanto à norma- 
lidade, linearidade e multicolinearidade é explicado 
no Capítulo 2. Para fins de nossa ilustração da análise 
discriminante, essas suposições são atendidas em níveis 
aceitáveis. 

A maioria dos programas estatísticos tem um ou mais 
teste(s) estatístico(s) para a suposição de matrizes de co- 
variância ou dispersão iguais abordada no Capítulo 2. O 
mais comum é o teste M de Box (para mais detalhes, ver 
Capítulo 2). 


Neste exemplo de dois grupos, a significância de dife- 
renças nas matrizes de covariância entre os dois gru- 
pos é de 0,011. Mesmo que a significância seja menor 
que 0,05 (nesse teste o pesquisador procura por valo- 
res acima do nível desejado de significância), a sensibi- 
lidade do teste a outros fatores que não sejam apenas 
diferenças de covariância (p.ex., normalidade das va- 
riáveis e tamanho crescente da amostra) faz desse um 
nível aceitável. 


Nenhuma ação corretiva adicional faz-se necessária 
antes que a estimação da função discriminante possa ser 
realizada. 
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Estágio 4: Estimação do modelo 
discriminante e avaliação do ajuste geral 


O pesquisador tem a escolha de duas técnicas de estima- 
ção (simultânea versus stepwise) para determinar as va- 
riáveis independentes incluídas na função discriminante. 
Uma vez que a técnica de estimação é escolhida, o pro- 
cesso determina a composição da função discriminante 
sujeita à exigência de significância estatística especificada 
pelo pesquisador. 


O principal objetivo dessa análise é identificar o con- 
junto de variáveis independentes (percepções HBAT) 
que diferencia ao máximo entre os dois grupos de 
clientes. Se o conjunto de variáveis de percepções fos- 
se menor ou a meta fosse simplesmente determinar 
as capacidades discriminantes do conjunto inteiro de 
variáveis de percepção, sem se preocupar com o im- 
pacto de qualquer percepção individual, então a abor- 
dagem simultânea de inclusão de todas as variáveis 
diretamente na função discriminante seria empregada. 
Mas neste caso, mesmo com o conhecimento de mul- 
ticolinearidade entre as variáveis de percepção vista 
no desempenho da análise fatorial (ver Capítulo 3), a 
abordagem stepwise é considerada mais adequada. De- 
vemos observar, porém, que multicolinearidade pode 
impactar sobre quais variáveis entram na função discri- 
minante e assim exigir particular atenção no processo 
de interpretação. 


Avaliação de diferenças de grupos 
Iniciemos nossa avaliação da análise discriminante de 
dois grupos examinando a Tabela 5-5, que mostra as mé- 
dias de grupos para cada uma das variáveis independen- 
tes, com base nas 60 observações que constituem a amos- 
tra de análise. 

Para identificar quais das cinco variáveis, mais alguma 
das demais, melhor discrimina entre os grupos, devemos 
estimar a função discriminante. 


Ao estabelecer o perfil dos dois grupos, podemos pri- 
meiramente identificar cinco variáveis com as maio- 
res diferenças nas médias de grupo (X,, X,,, X,,, X 1, € 
X,). A Tabela 5-5 também exibe o lambda de Wilks e a 
ANOVA univariada utilizada para avaliar a significân- 
cia entre médias das variáveis independentes para os 
dois grupos. Esses testes indicam que as cinco variáveis 
de percepção são também as únicas com diferenças uni- 
variadas significantes entre os dois grupos. Finalmente, 
os valores D” de Mahalanobis mínimos são também da- 
dos. Este valor é importante porque ele é a medida usa- 
da para selecionar variáveis para entrada no processo 
de estimação stepwise. Como apenas dois grupos estão 


envolvidos, o maior valor Dº tem também a diferença 
entre grupos mais significante (note que o mesmo fato 
não ocorre necessariamente com três ou mais grupos, 
nos quais grandes diferenças entre dois grupos quais- 
quer podem não resultar nas maiores diferenças gerais 
em todos os grupos, como será mostrado no exemplo 
de três grupos). 

O exame das diferenças de grupos leva à identifica- 
ção de cinco variáveis de percepção (X,, X 4, Xj, X1 € 
X,;) como o conjunto mais lógico de candidatos a entra- 
rem na análise discriminante. Essa considerável redução 
a partir do conjunto maior de 13 variáveis de percepção 
reforça a decisão de se usar um processo de estimação 
stepwise. 


Estimação da função discriminante 
O procedimento stepwise começa com todas as variáveis 
excluídas do modelo e então seleciona a variável que: 


1. Mostra diferenças estatisticamente significantes nos grupos 
(0,05 ou menos exigido para entrada) 
2. Dá a maior distância de Mahalanobis (D?) entre os grupos 


Este processo continua a incluir variáveis na função 
discriminante desde que elas forneçam discriminação adi- 
cional estatisticamente significante entre os grupos além 
daquelas diferenças já explicadas pelas variáveis na fun- 
ção discriminante.Esta técnica é semelhante ao processo 
stepwise em regressão múltipla (ver Capítulo 4), que adi- 
ciona variáveis com aumentos significantes na variância 
explicada da variável dependente. Além disso, em casos 
nos quais duas ou mais variáveis entram no modelo, as va- 
riáveis já presentes são avaliadas para possível remoção. 
Uma variável pode ser removida se existir elevada multi- 
colinearidade entre ela e as demais variáveis independen- 
tes incluídas, de modo que sua significância fica abaixo do 
nível para remoção (0,10). 


Estimação stepwise: adição da primeira variável 
X, A partir de nossa revisão de diferenças de gru- 
pos, percebemos que X,, tinha a maior diferença signi- 
ficante entre grupos e o maior Dº de Mahalanobis (ver 
Tabela 5-5). Logo, X,, entra como a primeira variável 
no procedimento stepwise (ver Tabela 5-6). Como ape- 
nas uma variável entra no modelo discriminante neste 
momento, os níveis de significância e as medidas de 
diferenças de grupos coincidem com aqueles dos testes 
univariados. 

Depois que X,, entra no modelo, as demais variáveis 
são avaliadas com base em suas habilidades discriminan- 
tes incrementais (diferenças de médias de grupos depois 


(Continua) 


254 Análise Multivariada de Dados 


TABELA 5-5 Estatísticas descritivas de grupo e testes de igualdade para a amostra de estimação na análise discriminante de dois grupos 


Médias de grupos da variá- Teste de igualdade de médias de Dº de Mahalanobis 
vel dependente: X, Região grupos* mínimo 


Grupo O: Grupo 1: 
EUA/Améri- Fora da Amé- 


cado Norte ricado Norte Lambda Significân- Entre 
Variáveis independentes (n=26) (n=34) de Wilks Valor F cia D' mínimo grupos 

X; Qualidade do produto 8,527 7,297 0,801 14,387 0,000 0,976 0e1 
X, Atividades de Comércio eletrônico 3,388 3,626 0,966 2,054 0,157 0,139 0e1 
X, Suporte técnico 5,569 5,050 0,973 1,598 0,211 0,108 0e1 
X, Solução de reclamação 5,577 5,253 0,986 0,849 0,361 0,058 0e1 
Xo Anúncio 3,727 3,979 0,987 0,775 0,382 0,053 0e1 
X, Linha do produto 6,785 5,274 0,695 25,500 0,000 1,731 0e1 
X, Imagem da equipe de venda 4,427 5,238 0,856 9,733 0,003 0,661 0e1 
X, Preço competitivo 5,600 7,418 0,645 31,992 0,000 2171 0e1 
X, Garantia e reclamações 6,050 5,918 0,992 0,453 0,503 0,031 0e1 
X, Novos produtos 4,954 5,276 0,990 0,600 0,442 0,041 0e1 
Xj, Encomenda e cobrança 4,231 4,153 0,999 0,087 0,769 0,006 0e1 
X; Flexibilidade de preço 3,631 4,932 0,647 31,699 0,000 2,152 0e1 
Xj Velocidade de entrega 3,873 3,794 0,997 0,152 0,698 0,010 0e1 


* Lambda de Wilks (estatística U) e razão F univariada com 1 e 58 graus de liberdade. 


(Continuação) 
que a variância associada com X,, é removida). Nova- 
mente, variáveis com níveis de significância maiores que 
0,05 são eliminadas de consideração para entrada no 
próximo passo. 

O exame das diferenças univariadas mostradas na 
Tabela 5-5 identifica X,, (Flexibilidade de preço) como 
a variável com a segunda maior diferença. No entanto, 
o processo stepwise não utiliza esses resultados univa- 
riados quando a função discriminante tem uma ou mais 
variáveis. Ele calcula os valores D? e os testes de signi- 
ficância estatística de diferenças de grupos depois que o 
efeito das variáveis nos modelos é removido (neste caso 
apenas X,, está no modelo). 

Como mostrado na última parte da Tabela 5-6, três 


0,478. Além disso, o poder discriminante de ambas as va- 
riáveis incluídas nesse ponto é também estatisticamente 
significante (valores F de 20,113 para X,, e 19,863 para 
X,,). Com ambas as variáveis estatisticamente significan- 
tes, o procedimento se dirige para o exame das variáveis 
fora da equação na busca de potenciais candidatos para 
inclusão na função discriminante com base em sua dis- 
criminação incremental entre os grupos. 

X, é a próxima variável a atender às exigências para 
inclusão, mas seu nível de significância e sua habilida- 
de discriminante foram reduzidos substancialmente por 
conta da multicolinearidade com X,, e X,, já na função 
discriminante. Mais notável ainda é o considerável au- 
mento no Dº de Mahalanobis em relação aos resultados 


variáveis (X,, X,, € X,,) claramente atendem ao crité- 
rio de nível de significância de 0,05 para consideração no 
próximo estágio. X,, permanece como o próximo melhor 
candidato a entrar no modelo porque ela tem o maior 
D” de Mahalanobis (4,300) e o maior valor F a entrar. 
Não obstante, outras variáveis (p.ex., X,,) têm substan- 
ciais reduções em seu nível de significância e no Dº de 
Mahalanobis em relação ao que se mostra na Tabela 5-5 
devido à variável única no modelo (X,,). 


Estimação stepwise: adição da segunda variável X,. No 
passo 2 (ver Tabela 5-7), X,, entra no modelo, conforme 
esperado. O modelo geral é significante (F = 31,129) e 
melhora a discriminação entre grupos, como evidencia- 
do pela diminuição no lambda de Wilks de 0,645 para 


univariados nos quais cada variável é considerada sepa- 
radamente. No caso de X,, o valor Dº mínimo aumenta 
de 1,731 (ver Tabela 5-5) para 5,045 (Tabela 5-7), o que 
indica um espalhamento e uma separação dos grupos 
por conta de X,, e X,, já na função discriminante. Note 
que X,, é quase idêntica em poder discriminante rema- 
nescente, mas X,, entrará no terceiro passo devido à sua 
pequena vantagem. 


Estimação stepwise: adição de uma terceira variável 
X,. A Tabela 5-8 revê os resultados do terceiro passo 
do processo stepwise, onde X,, entra na função discri- 
minante. Os resultados gerais ainda são estatisticamente 
significantes e continuam a melhorar na discriminação, 


como evidenciado pela diminuição no valor lambda de 
(Continua) 
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TABELA 5-6 Resultados do passo 1 da análise discriminante stepwise de dois grupos 


Ajuste geral do modelo 


Valor Valor F Graus de liberdade Significância 
Lambda de Wilks 0,645 31,992 1,58 0,000 
Variáveis adicionadas/removidas no passo 1 
F 
Variável adicionada Dº mínimo Valor Significância Entre grupos 
X,3 Preços competitivos 2171 31,992 0,000 0e1 


Nota: Em cada passo, a variável que maximiza a distância de Mahalanobis entre os dois grupos mais próximos é adicionada. 


Variáveis na análise após o passo 1 


Variável Tolerância F para remover D Entre grupos 
X,3 Preços competitivos 1,000 31,992 
Variáveis fora da análise após o passo 1 
Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
X, Qualidade de produto 0,965 0,965 4,926 2,699 0e1 
X, Atividades de comércio eletrônico 0,917 0,917 0,026 2,174 0e1 
X, Suporte técnico 0,966 0,966 0,033 2,175 0e1 
X, Solução de reclamação 0,844 0,844 1,292 2,910 0e1 
Xo Anúncio 0,992 0,992 0,088 2,181 0e1 
X, Linha de produto 0,849 0,849 6,076 2,822 0e1 
X,, Imagem da equipe de venda 0,987 0,987 3,949 2,595 0e1 
X,, Garantia e reclamações 0,918 0,918 0,617 2,237 0e1 
X,s Novos produtos 1,000 1,000 0,455 2,220 0e1 
X,, Encomenda e cobrança 0,836 0,836 3,022 2,495 0e1 
X, Flexibilidade de preço 1,000 1,000 19,863 4,300 0e1 
X, Velocidade de entrega 0,910 0,910 1,196 2,300 0e1 


Teste de significância de diferenças de grupos após o passo 1º 


EUA/América do Norte 


F 
Sig. 


Fora da América do Norte 


31,992 
0,000 


1,58 graus de liberdade 


(Continuação) 


Wilks (de 0,478 para 0,438). Note, porém, que a queda 
foi muito menor do que aquela encontrada quando a 
segunda variável (X,,) foi adicionada à função discrimi- 
nante. Com X,,, X,, e X,, estatisticamente significantes, 
o procedimento se dirige para a identificação de candi- 
datos remanescentes para inclusão. 

Como visto na última parte da Tabela 5-8, nenhuma 
das 10 variáveis independentes que sobraram passam 
pelo critério de entrada de significância estatística de 
0,05. Depois que X,, entrou na equação, as duas variá- 
veis remanescentes que tinham diferenças univariadas 
significantes nos grupos (X, e X,,) apresentam um po- 
der discriminatório adicional relativamente pequeno e 
não atendem ao critério de entrada. Assim, o processo 


de estimação pára com as três variáveis (X,,, X, e X,,) 
constituindo a função discriminante. 


Resumo do processo de estimação stepwise. A Tabela 
5-9 fornece os resultados gerais da análise discriminan- 
te stepwise depois que todas as variáveis significantes 
foram incluídas na estimação da função discriminante. 
Essa tabela resumo descreve as três variáveis (X,,, X,, € 
X,) que são discriminadores significantes com base em 
seus lambda de Wilks e nos valores mínimos de D” de 
Mahalanobis. 

Diversos resultados distintos são dados abordando 
tanto o ajuste geral do modelo quanto o impacto de va- 
riáveis específicas. 
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TABELA 5-7 Resultados do passo 2 da análise discriminante stepwise de dois grupos 


Ajuste geral do modelo 


Valor Valor F Graus de liberdade Significância 
Lambda de Wilks 0,478 31,129 2,57 0,000 
Variáveis adicionadas/removidas no passo 2 
F 
Variável adicionada Dº mínimo Valor Significância Entre grupos 
4,300 31,129 0,000 0e1 


X,3 Flexibilidade de preço 


Nota: Em cada passo, a variável que maximiza a distância de Mahalanobis entre os dois grupos mais próximos é adicionada. 


Variáveis na análise após o passo 2 


Variável Tolerância F para remover [DÁ Entre grupos 
X,3 Preços competitivos 1,000 20,113 2,152 0e1 
X, Flexibilidade de preço 1,000 19,863 2171 0e1 
Variáveis fora da análise após o passo 2 
Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
X Qualidade de produto 0,884 0,884 0,681 4,400 0e1 
X, Atividades de comércio eletrônico 0,804 0,804 2,486 4,665 0e1 
X, Suporte técnico 0,966 0,966 0,052 4,308 0e1 
X, Solução de reclamação 0,610 0,610 1,479 4,517 0e1 
Xo Anúncio 0,901 0,901 0,881 4,429 0e1 
X, Linha de produto 0,848 0,848 5,068 5,045 0e1 
X,» Imagem da equipe de venda 0,944 0,944 0,849 4,425 0e1 
X Garantia e reclamações 0,916 0,916 0,759 4,411 0e1 
X,; Novos produtos 0,986 0,986 0,017 4,302 0e1 
X,. Encomenda e cobrança 0,625 0,625 0,245 4,336 0e1 
X Velocidade de entrega 0,519 0,519 4,261 4,927 0e1 


Teste de significância de diferenças de grupos após o passo 2º 


EUA/América do Norte 


Fora da América do Norte F 
Sig. 
“2,57 graus de liberdade 


32,129 
0,000 


(Continuação) 

e As medidas multivariadas de ajuste geral do modelo 
são relatadas sob a legenda "Funções discriminantes 
canônicas". Observe que a função discriminante é al- 
tamente significante (0,000) e retrata uma correlação 
canônica de 0,749. Interpretamos essa correlação ele- 
vando-a ao quadrado (0,749)= 0,561. Logo, 56,1% da 
variância na variável dependente (X,) pode ser explica- 
da por este modelo, o qual inclui apenas três variáveis 
independentes. 

e Os coeficientes padronizados da função discriminante 
são fornecidos, mas são menos preferidos para fins de 
interpretação do que as cargas discriminantes. Os coe- 
ficientes discriminantes não-padronizados são usados 
para calcular os escores Z discriminantes que podem 
ser empregados na classificação. 


As cargas discriminantes são relatadas sob a legenda 
"Matriz estrutural" e são ordenadas da maior para a 
menor em termos de tamanho da carga. As cargas são 
discutidas depois na fase de interpretação (estágio 5). 
Os coeficientes da função de classificação, também 
conhecidos como funções discriminantes lineares de 
Fisher, são utilizados na classificação e discutidos poste- 
riormente. 

Centróides de grupo são também relatados, e eles re- 
presentam a média dos escores individuais da função 
discriminante para cada grupo. Centróides fornecem 
uma medida resumo da posição relativa de cada grupo 
nas funções discriminantes. Neste caso, a Tabela 5-9 
revela que o centróide de grupo para as firmas nos 
EUA/América do Norte (grupo 0) é 1,273, enquanto 
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TABELA 5-8 Resultados do passo 3 da análise discriminante stepwise de dois grupos 


Ajuste geral do modelo 


Valor Valor F Graus de liberdade Significância 
Lambda de Wilks 0,438 23,923 3,56 0,000 
Variáveis adicionadas/removidas no passo 3 
F 
Dº mínimo Valor Significância Entre grupos 
X,, Linha de produto 5,045 23,923 0,000 0e1 


Nota: Em cada passo, a variável que maximiza a distância de Mahalanobis entre os dois grupos mais próximos é adicionada. 


Variáveis na análise após o passo 3 


Variável Tolerância F para remover [DÁ Entre grupos 
X, Preços competitivos 0,849 7,258 4,015 0e1 
X, Flexibilidade de preço 0,999 18,416 2,822 0e1 
X,, Linha de produto 0,848 5,068 4,300 0e1 
Variáveis fora da análise após o passo 3 
Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
X, Qualidade de produto 0,802 0,769 0,019 5,048 0e1 
X, Atividades de comércio eletrônico 0,801 0,791 2,672 5,482 0e1 
X; Suporte técnico 0,961 0,832 0,004 5,046 0e1 
X Solução de reclamação 0,233 0,233 0,719 5,163 0e1 
Xo Anúncio 0,900 0,840 0,636 5,149 0e1 
X,» Imagem da equipe de venda 0,931 0,829 1,294 5,257 0e1 
X, Garantia e reclamações 0,836 0,775 2,918 5,424 0e1 
X, Novos produtos 0,981 0,844 0,076 5,058 0e1 
X,. Encomenda e cobrança 0,400 0,400 1,025 5,213 0e1 
Xe Velocidade de entrega 0,031 0,031 0,208 5,079 0e1 
Teste de significância de diferenças de grupos após o passo 3º 
EUA/América do Norte 
Fora da América do Norte F 23,923 
Sig. 0,000 


“3,56 graus de liberdade 


(Continuação) 
o centróide para as firmas fora da América do Norte 
(grupo 1) é 0,973. Para mostrar que a média geral é 0, 
multiplique o número em cada grupo por seu centróide 
e some ao resultado (p.ex., 26 x —1,273 + 34x 0,973 
= 0,0). 


Os resultados do modelo geral são aceitáveis com base 
em significância estatística e prática. No entanto, antes de 
proceder com uma interpretação dos resultados, o pesqui- 
sador precisa avaliar a precisão de classificação e exami- 
nar os resultados caso a caso. 


Avaliação da precisão de classificação 
Com o modelo geral estatisticamente significante e expli- 
cando 56% da variação entre os grupos (ver a discussão 


anterior e a Tabela 5-9), passamos para a avaliação de 
precisão preditiva da função discriminante. Em tal pro- 
cesso devemos completar três tarefas: 


1. Calcular o escore de corte, o critério no qual o escore Z dis- 
criminante de cada observação é julgado para determinar 
em qual grupo ela deve ser classificada. 

2. Classificar cada observação e desenvolver as matrizes de 
classificação para as amostras de análise e de teste. 

3. Avaliar os níveis de precisão preditiva a partir das ma- 
trizes de classificação quanto a significância estatística e 
prática. 


Apesar de o exame da amostra de teste e de sua preci- 
são preditiva ser realmente feito no estágio de validação, 
os resultados são discutidos agora para facilitar a compa- 
ração entre as amostras de estimação e de teste. 
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TABELA 5-9 Estatísticas resumo para análise discriminante de dois grupos 


Ajuste geral do modelo: funções discriminantes canônicas 


Percentual de variância 


Correlação Lambda de  Qui-qua- 
Função Autovalor Função % Cumulativo % canônica Wilks drado df Significância 
1 1,282 100 100 0,749 0,438 46,606 3 0,000 


Função discriminante e coeficientes da função de classificação 


Funções discriminantes 


Funções de classificação 


Grupo O: EUA/América Grupo 1: Fora da América 


Variáveis independentes Não-padronizado Padronizado do Norte do Norte 
X; Linha de produto —0,363 —0,417 7,125 6,909 
X;3 Preços competitivos 0,398 0,490 6,456 7,349 
X; Flexibilidade de preço 0,749 0,664 4,231 5,912 
Constante -3,/52 —52,800 —60,623 
Matriz estrutural” 

Variáveis independentes Função 1 
X3 Preços competitivos 0,656 
X Flexibilidade de preço 0,653 
X, Linha de produto —0,586 
X, Atividades de comércio eletrônico* 0,429 
X, Qualidade de produto* —0,418 
X, Garantia e reclamações* —0,329 
Xo Anúncio* 0,238 
X Solução de reclamações* -0,181 
X,» Imagem da equipe de venda* 0,164 
Xe Encomenda e cobrança* —0,149 
X; Suporte técnico* —0,136 
Xe Velocidade de entrega” —0,060 
X,5 Novos produtos* 0,041 


*Variável não usada na análise 


Médias de grupos (centróides) de funções discriminantes 


X, Região Função 1 
EUA/América do Norte —1,278 
Fora da América do Norte 0,973 


?Correlações internas de grupos entre variáveis discriminantes e funções discriminantes canônicas padronizadas ordenadas por tamanho absoluto de correlação 


na função, 


Cálculo do escore de corte. O pesquisador deve primei- 
ramente determinar como as probabilidades a priori de 
classificação são determinadas, ou com base nos tama- 
nhos reais dos grupos (assumindo que eles são represen- 
tativos da população), ou especificadas pelo pesquisador, 
sendo que mais frequentemente são estabelecidas como 
iguais em uma postura conservadora do processo de clas- 
sificação. 


Nesta amostra de análise de 60 observações, sabemos 
que a variável dependente consiste em dois grupos, 26 
empresas localizadas nos EUA e 34 empresas fora do 
país. Se não estamos certos de que as proporções da po- 


pulação são representadas pela amostra, então devemos 
empregar probabilidades iguais. No entanto, como nos- 
sa amostra de empresas é aleatoriamente extraída, po- 
demos estar razoavelmente certos de que essa amostra 
reflete as proporções da população. Logo, essa análise 
discriminante usa as proporções da amostra para especi- 
ficar as probabilidades a priori para fins de classificação. 
Tendo especificado as probabilidades a priori, o escore 
de corte ótimo pode ser calculado. Como nesta situação 
os grupos são considerados representativos, o cálculo 
se torna uma média ponderada dos dois centróides de 
grupos: 
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Ze N,Z,+NoZ, (26x0,973)+(34x 1,273) 


0,2997 
o NEN. 26+34 


Substituindo os valores apropriados na fórmula, po- 
demos obter o escore de corte crítico (assumindo custos 
iguais de má classificação) de Zes = —0,2997. 


Classificação de observações e construção de matrizes de 
classificação. Uma vez que o escore de corte tenha sido 
calculado, cada observação pode ser classificada compa- 
rando seu escore discriminante com o de corte. 


O procedimento para classificar empresas com o escore 
de corte ótimo é o seguinte: 


e Classifique uma empresa como sendo do grupo O (Esta- 
dos Unidos/América do Norte) se seu escore discrimi- 
nante for menor que —0,2997. 

e Classifique uma empresa como sendo do grupo 1 (Fora 
dos Estados Unidos) se seu escore discriminante for 
maior que —0,2997. 


Matrizes de classificação para as observações nas 
amostras de análise e de validação foram calculadas, e 
os resultados são exibidos na Tabela 5-10. A amostra de 
análise tem 86,7% de precisão de previsão, que é ligeira- 
mente maior que a precisão de 85% da amostra de teste, 
como já antecipado. Além disso, a amostra que passou 
por validação cruzada conseguiu uma precisão preditiva 
de 83,3%. 


Avaliação da precisão de classificação atingida. Ainda 
que todas as medidas de precisão de classificação sejam 


bastante altas, o processo de avaliação requer uma com- 
paração com a precisão de classificação em uma série de 
medidas baseadas em chances. Essas medidas refletem 
a melhora do modelo discriminante quando se compara 
com a classificação de indivíduos sem o uso da função dis- 
criminante. Sabendo-se que a amostra geral é de 100 ob- 
servações e que os grupos de teste/validação são menores 
do que 20, usaremos a amostra geral para estabelecer os 
padrões de comparação. 

A primeira medida é o critério de chance proporcio- 
nal, o qual considera que os custos da má classificação são 
iguais (ou seja, queremos identificar os membros de cada 
grupo igualmente bem). O critério de chance proporcio- 
nal é: 


Cpro — p' Sd — py 
onde 


Cpro = critério de chance proporcional 
p = proporção de empresas no grupo O 
1-p = proporção de empresas no grupo 1 


O grupo de clientes localizados nos Estados Unidos 
(grupo 0) constitui 39,0% da amostra de análise (39/100), 
com o segundo grupo representando clientes localizados 
fora dos Estados Unidos (grupo 1) formando os 61,0% 
restantes. O valor calculado de chance proporcional é de 
0,524 (0,390” + 0,610” = 0,524). 


O critério de chance máxima é simplesmente o per- 
centual corretamente classificado se todas as observações 
fossem colocadas no grupo com a maior probabilidade 
de ocorrência. Ele reflete nosso padrão mais conserva- 


TABELA 5-10 Resultados de classificação para análise discriminante de dois grupos 


a,b,c 


Resultados de classificação 


Pertinência prevista em grupo 


Amostra Grupo real EUA/América do Norte Fora da América do Norte Total 
Amostra de estimação EUA/América do Norte 25 1 26 
96,2% 3,8% 
Fora da América do Norte 7 27 34 
20,6% 79,4% 
Amostra de validação cruzada”. EUA/América do Norte 24 2 26 
92,3 TATA 
Fora da América do Norte 8 26 34 
23,5 76,5 
Amostra de teste EUA/América do Norte 9 4 13 
69,2 30,8 
Fora da América do Norte 2 25 27 
7,4 92,6 


86,7% dos casos originais selecionados e agrupados (amostra de estimação) corretamente classificados. 

*85,0% dos casos originais não-selecionados e agrupados (amostra de validação) corretamente classificados. 

“83,3% dos casos selecionados validados por cruzamento corretamente classificados. 

“Validação cruzada é feita somente para aqueles casos da análise (amostra de estimação). Em validação cruzada, cada caso é classificado pelas funções 


derivadas de todos os casos distintos daquele. 
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dor e assume nenhuma diferença no custo de uma má 
classificação. 


Como o grupo 1 (clientes fora dos Estados Unidos) é o 
maior, com 61% da amostra, estaríamos corretos 61,0% 
do tempo se designássemos todas as observações a esse 
grupo. Se escolhemos o critério de chance máxima como 
o padrão de avaliação, nosso modelo deve ter um de- 
sempenho superior a 61% de precisão de classificação 
para ser aceitável. 


Para tentar garantir significância prática, a precisão de 
classificação alcançada deve exceder o padrão de compa- 
ração escolhido em 25%. Assim, devemos selecionar um 
padrão de comparação, calcular o valor de referência e 
comparar com a razão de sucesso conseguida. 


Todos os níveis de precisão de classificação (razões 
de sucesso) excedem 85%, o que é consideravelmente 
maior do que o critério de chance proporcional de 52,4% 
ou mesmo do critério de chance máxima de 61,0%. 
Todas as três razões também excedem o valor de refe- 
rência sugerido desses valores (padrão de comparação 
mais 25%), que neste caso é de 65,5% (52,4% x 1,25 = 
65,5%) para a chance proporcional e 76,3% (61,0% x 
1,25 = 76,3%) para a chance máxima. Em todos os casos 
(amostra de análise, de teste e de validação cruzada), os 
níveis de precisão de classificação são substancialmente 
maiores do que os valores de referência, indicando um 
nível aceitável de precisão de classificação. Além disso, 
a razão de sucesso para grupos individuais é considerada 
adequada também. 


A medida final de precisão de classificação é o O de 
Press, que é uma medida estatística que compara precisão 
de classificação com um processo aleatório. 


A partir da discussão anterior, o cálculo para a amostra 
de estimação é 


[60-(52x2)2 


(9) de PresS mostra de estimação = = 45 07 
60(2-1) 
E o cálculo para a amostra de validação é 
2 
Q de Press ostra de teste — Eis Ra = 19, 6 


40(2-1) 


Em ambos os casos, os valores calculados excedem o 
valor crítico de 6,63. Assim, a precisão de classificação para 
a amostra de análise e, mais importante, para a amostra de 
validação excede em um nível estatisticamente significante 
a precisão esperada de classificação por chance. 


O pesquisador sempre deve lembrar de tomar cuidado 
na aplicação de uma amostra de validação com pequenos 
conjuntos de dados. Nesse caso, a pequena amostra de 40 
para validação foi adequada, mas tamanhos maiores são 
sempre mais desejáveis. 


Diagnósticos por casos 

Além dos resultados gerais, podemos examinar as obser- 
vações individuais no que se refere à precisão preditiva e 
identificar especificamente os casos mal classificados. Nes- 
ta operação, podemos encontrar os casos específicos mal 
classificados para cada grupo nas amostras de análise e de 
teste e ainda promover uma análise adicional na qual se 
determine o perfil dos casos mal classificados. 


A Tabela 5-11 contém as previsões de grupo para as 
amostras de análise e de validação e nos permite identifi- 
car os casos específicos para cada tipo de má classificação 
tabulada nas matrizes de classificação (ver Tabela 5-10). 
Para a amostra de análise, os sete clientes localizados 
fora dos Estados Unidos que foram mal classificados no 
grupo de clientes na América do Norte podem ser iden- 
tificados como os casos 3, 94, 49, 64, 24, 53 e 32. Ana- 
logamente, o único cliente dos Estados Unidos que foi 
mal classificado é identificado como caso 43. Um exame 
semelhante pode ser feito para a amostra de validação. 


Assim que os casos mal classificados são identifica- 
dos, uma análise adicional pode ser realizada para com- 
preender as razões dessa má classificação. Na Tabela 
5-12, os casos mal classificados são combinados a partir 
das amostras de análise e de validação e então compara- 
dos com os casos corretamente classificados. O objetivo 
é identificar diferenças específicas nas variáveis indepen- 
dentes que possam identificar novas variáveis a serem 
acrescentadas ou características em comum que devam 
ser consideradas. 


Os cinco casos (tanto na amostra de análise quanto na de 
validação) mal classificados entre os clientes dos Estados 
Unidos (grupo 0) têm diferenças significantes em duas 
das três variáveis independentes na função discriminante 
(X,, e X,;), bem como em uma variável não incluída na 
função discriminante (X,). Para tal variável, o perfil dos 
casos mal classificados não é semelhante ao seu grupo 
correto; logo, não ajuda na classificação. Analogamente, 
os nove casos mal classificados do grupo 1 (fora dos Es- 
tados Unidos) mostram quatro diferenças significantes 
(Xo X 1, X1 € X,), mas apenas X, não está na função 
discriminante. Podemos ver que aqui X, funciona contra 
a precisão de classificação porque os casos mal classifi- 
cados são mais semelhantes ao grupo incorreto do que 
ao outro. 


(Continua) 
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TABELA 5-11 Previsões de grupo para casos individuais na análise discriminante de dois grupos 


Identificação Escore Z Identificação Escore Z 
do caso Grupo real discriminante Grupo previsto de caso Grupo real discriminante Grupo previsto 


Amostra de análise 


72 0 —2,10690 0 24 1 —0,60937 0 
14 0 —2,03496 0 53 1 —0,45623 0 
31 0 —1,98885 0 32 1 —0,36094 0 
54 0 —1,98885 0 80 1 —0,14687 1 
27 0 —1,76053 0 38 1 —0,04489 1 
29 0 —1,76053 0 60 1 —0,04447 1 
16 0 —1,71859 0 65 1 0,09785 1 
61 0 —1,71859 0 35 1 0,84464 1 
79 0 —1,57916 0 1 1 0,98896 1 
36 0 —1,57108 0 4 1 1,10834 1 
98 0 —1,57108 0 68 1 1,12436 1 
58 0 —1,48136 0 44 1 1,3476068 1 
45 0 —1,33840 0 17 1 1,35578 1 
2 0 —1,29645 0 67 1 1,35578 1 
52 0 —1,29645 0 33 1 1,42147 1 
50 0 —1,24651 0 87 1 1,57544 1 
47 0 —1,20903 0 6 1 1,58353 1 
88 0 —1,10294 0 46 1 1,60411 | 
11 0 —0,74943 0 12 1 1,75931 1 
56 0 -0,73978 0 69 1 1,82233 1 
95 0 -0,73978 0 86 1 1,82233 1 
81 0 —-0,72876 0 10 1 1,85847 1 
5 0 —0,60845 0 30 1 1,90062 1 
37 0 —0,60845 0 15 1 1,91724 1 
(ox) 0 —0,38398 0 92 1 1,97960 1 
43 0 0,23553 1 7 1 2,09505 1 
3 1 —1,65744 0 20 1 2,22839 1 
94 1 —1,57916 0 8 1 2,39938 | 
49 1 —1,04667 0 100 1 2,62102 1 
64 1 —0,67406 0 48 1 2,90178 1 
Amostra de teste 
23 0 22,38834 0 25 1 1,47048 1 
93 0 —2,03496 0 18 1 1,60411 1 
59 0 —1,20903 0 73 1 1,61002 1 
85 0 —1,10294 0 21 1 1,69348 1 
83 0 —1,03619 0 90 1 1,69715 1 
91 0 —0,89292 0 97 1 1,70398 1 
82 0 —0,74943 0 40 1 1,7593831 1 
76 0 —0,72876 0 77 1 1,86055 1 
96 0 —0,57335 0 28 1 1,97494 1 
13 0 0,13119 1 71 1 2,22839 1 
89 0 0,51418 1 19 1 2,28652 1 
42 0 0,63440 1 57 1 2,31456 1 
78 0 0,63440 1 9 1 2,36823 1 
22 1 —2,73303 0 41 1 2,53652 1 
74 1 —1,04667 0 26 1 2,59447 1 
51 1 0,09785 1 70 1 2,59447 1 
62 1 0,94702 1 66 1 2,90178 1 
75 1 0,98896 1 34 1 2,97632 1 
99 1 1,13130 1 55 1 2,97632 1 
84 1 1,30393 1 39 1 3,21116 1 
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TABELA 5-12 Perfil de observações corretamente classificadas e mal classificadas na análise discriminante de dois grupos 


Escores médios Teste t 
Variável dependente: Corretamente Mal Significância 
X, Região Variáveis (Grupo/Perfil) classificada classificada Diferença estatística 

EUA/América do 

Norte (n= 34) (n=5) 
X Qualidade do produto 8,612 9,340 —0,728 0,000" 
X, Atividades de comércio eletrônico 3,382 4,380 —0,998 0,068” 
X; Suporte técnico 5,759 5,280 0,479 0,487 
X Solução de reclamação 5,956 6,140 —0,784 0,149 
Xjo Anúncio 3,597 4,700 —1,103 0,022 
X, Linha do produto? 6,726 6,540 0,186 0,345" 
X,, Imagem da equipe de venda 4,459 5,460 —1,001 0,018 
X; Preços competitivos” 5,609 8,060 —2,451 0,000 
X Garantia e reclamações 6,215 6,060 0,155 0,677 
X,s Novos produtos 5,024 4,420 0,604 0,391 
Xe Encomenda e cobrança 4,188 4,540 —0,352 0,329 
X, Flexibilidade de preço” 3,568 4,480 —0,912 0,000" 
Xe Velocidade de entrega 3,826 4,160 —0,334 0,027” 

Fora da América do 

Norte (n= 52) (n=9) 
X Qualidade do produto 6,906 9,156 —2,250 0,000 
X, Atividades de comércio eletrônico 3,860 3,289 0,571 0,159 
X; Suporte técnico 5,085 5,544 —0,460 0,423 
X Solução de reclamação 5,965 5,822 —0,457 0,322 
Xo Anúncio 4,229 3,922 0,307 0,470 
X, Linha do produto? 4,954 6,833 —1,879 0,000 
X,» Imagem da equipe de venda 5,465 5,467 —1,282E-03 0,998 
X; Preços competitivos” 7,960 5,833 2,126 0,000 
Xj Garantia e reclamações 5,867 6,400 —0,533 0,007 
X, Novos produtos 5,194 5,778 —0,584 0,291 
Xe Encomenda e cobrança 4,267 4,533 —0,266 0,481 
X, Flexibilidade de preço? 5,458 3,722 1,735 0,000 
X Velocidade de entrega 3,881 3,989 —0,108 0,714 


Nota: Casos das amostras de análise e validação incluídos para a amostra total de 100. 


“Variáveis incluídas na função discriminante. 


“Teste t executado com estimativas separadas de variância no lugar de uma estimativa coletiva, pois o teste Levene detectou diferenças significantes nas variações 


entre os dois grupos. 


(Continuação) 
As descobertas sugerem que os casos mal classifi- 


cados podem representar um terceiro grupo, pois eles 
compartilham perfis muito semelhantes nessas variáveis, 
mais do que acontece nos dois grupos existentes. A ad- 
ministração pode analisar esse grupo quanto a variáveis 
adicionais ou avaliar se um padrão geográfico entre os 
casos mal classificados justifica um terceiro grupo. 


Pesquisadores devem examinar os padrões em ambos 
os grupos com o objetivo de entender as características 
comuns a eles em uma tentativa de definir os motivos para 
a má classificação. 


Estágio 5: Interpretação dos resultados 


Após estimar a função, a próxima fase é a interpretação. 
Este estágio envolve o exame da função para determinar 


a importância relativa de cada variável independente na 
discriminação entre os grupos, interpretar a função dis- 
criminante com base nas cargas discriminantes, e então 
fazer o perfil de cada grupo sobre o padrão de valores 
médios para variáveis identificadas como discriminadoras 
importantes. 


Identificação de variáveis discriminantes importantes 
Como anteriormente discutido, cargas discriminantes são 
consideradas a medida mais adequada de poder discrimi- 
nante, mas consideraremos também os pesos discriminan- 
tes para fins de comparação. Os pesos discriminantes, na 
forma padronizada ou não, representam a contribuição 
de cada variável à função discriminante. Contudo, como 
discutiremos, multicolinearidade entre as variáveis inde- 
pendentes pode causar impacto na interpretação usando 
somente os pesos. 
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Cargas discriminantes são calculadas para cada va- 
riável independente, mesmo para aquelas que não estão 
incluídas na função discriminante. Assim, pesos* discri- 
minantes representam o único impacto de cada variável 
independente e não são restritas apenas ao impacto com- 
partilhado devido à multicolinearidade. Além disso, como 
elas são relativamente pouco afetadas pela multicolineari- 
dade, elas representam mais precisamente a associação de 
cada variável com o escore discriminante. 


A Tabela 5-13 contém o conjunto inteiro de medidas 
interpretativas, incluindo pesos discriminantes padro- 
nizados e não-padronizados, cargas para a função dis- 
criminante, lambda de Wilks e a razão F univariada. As 
13 variáveis independentes originais foram examinadas 
pelo procedimento stepwise, e três (X,, X,; e X,,) são 
suficientemente significantes para serem incluídas na 
função. Para fins de interpretação, ordenamos as variá- 
veis independentes em termos de suas cargas e valores F 
univariados — ambos indicadores do poder discriminante 
de cada variável. Sinais dos pesos ou cargas não afetam a 
ordem; eles simplesmente indicam uma relação positiva 
ou negativa com a variável dependente. 


Análise de lambda de Wilks e o Funivariado. O lambda 
de Wilks e o F univariado representam os efeitos sepa- 
rados ou univariados de cada variável, não consideran- 
do multicolinearidade entre as variáveis independentes. 
Análogos às correlações bivariadas da regressão múltipla, 
eles indicam a habilidade de cada variável para discrimi- 
nar entre os grupos, mas apenas separadamente. Para in- 
terpretar qualquer combinação de duas ou mais variáveis 


*N. de R. T.: A palavra correta seria “cargas”. 


independentes, exige-se análise dos pesos ou cargas dis- 
criminantes como descrito nas próximas seções. 


A Tabela 5-13 mostra que as variáveis (X,, X, e X,;) com 
os três maiores valores F (e os menores lambdas de Wi- 
lks) eram também as variáveis que entraram na função 
discriminante. X,, porém, tinha um efeito discriminante 
significante quando considerada separadamente, mas tal 
efeito era compartilhado com as outras três variáveis, de 
maneira que sozinha ela não contribuía suficientemente 
para entrar na função discriminante. Todas as demais va- 
riáveis tinham valores F não-significantes e valores lamb- 
da de Wilks correspondentemente elevados. 


Análise dos pesos discriminantes. Os pesos discrimi- 
nantes estão disponíveis em formas não-padronizadas 
e padronizadas. Os pesos não-padronizados (mais a 
constante) são usados para calcular o escore discrimi- 
nante, mas podem ser afetados pela escala da variável 
independente (exatamente como pesos de regressão 
múltipla). Assim, os pesos padronizados refletem mais 
verdadeiramente o impacto de cada variável sobre a fun- 
ção discriminante e são mais apropriados para fins de 
interpretação. Se for usada estimação simultânea, mul- 
ticolinearidade entre quaisquer variáveis independentes 
causará impacto sobre os pesos estimados. No entanto, o 
impacto da multicolinearidade pode ser até maior para o 
procedimento stepwise, pois ela afeta não somente os pe- 
sos mas pode também impedir que uma variável sequer 
entre na equação. 


A Tabela 5-13 fornece os pesos padronizados (coeficien- 
tes) para as três variáveis incluídas na função discrimi- 


TABELA 5-13 Resumo de medidas interpretativas para análise discriminante de dois grupos 


Lambda 
Coeficientes discriminantes Cargas discriminantes de Wilks Razão F univariada 
Não padroni- 
Variáveis independentes zados Padronizados Carga Ordenação Valor Valor F Sig. Ordenação 

X, Qualidade do produto NI NI —0,418 5 0,801 14,387 | 0,000 4 
X, Atividades de comércio NI NI 0,429 4 0,966 2,054 0,157 6 
eletrônico 
X Suporte técnico NI NI -0,136 1 0,973 1,598 0,211 Fá 
X Solução de reclamação NI NI -0,181 8 0,986 0,849 0,361 8 
Xo Anúncio NI NI 0,238 7 0,987 0,775 0,382 9 
X, Linha do produto —0,363 -0,417  -0,586 3 0,695 25,500 0,000 3 
X,» Imagem da equipe de venda NI NI 0,164 9 0,856 9,733 0,003 5 
X,s Preços competitivos 0,398 0,490 0,656 1 0,645 31,992 0,000 1 
X Garantia e reclamações NI NI —0,329 6 0,992 0,453 0,503 1 
X, Novos produtos NI NI 0,041 13 0,990 0,600 0,442 10 
Xe Encomenda e cobrança NI NI —0,149 10 0,999 0,087 0,769 13 
X, Flexibilidade de preço 0,749 0,664 0,653 2 0,647 31,699 0,000 2 
Xe Velocidade de entrega NI NI —0,060 12 0,997 0,152 0,698 12 


NI = Não incluído na função discriminante estimada 
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nante. O impacto da multicolinearidade sobre os pesos 
pode ser visto ao se examinar X,, e X,,. Essas duas variá- 
veis têm poder discriminante essencialmente equivalen- 
te quando vistas nos testes lambda de Wilks e F univa- 
riado. Seus pesos discriminantes, contudo, refletem um 
impacto sensivelmente maior para X,, do que para X,,, 
que agora é mais comparável com X,,. Essa mudança em 
importância relativa é devida à multicolinearidade entre 
X,, e X,, o que reduz o efeito único de X,, e assim dimi- 
nui os pesos discriminantes também. 


Interpretação da função discriminante 

com base nas cargas discriminantes 

As cargas discriminantes, em contraste com os pesos dis- 
criminantes, são menos afetadas pela multicolinearidade e, 
portanto, mais úteis para a interpretação. Além disso, como 
cargas são calculadas para todas as variáveis, elas fornecem 
uma medida interpretativa até mesmo para variáveis não 
incluídas na função discriminante. Uma regra prática ante- 
rior indicava que cargas acima de + 0,40 deveriam ser usa- 
das para identificar variáveis discriminantes importantes. 


As cargas das três variáveis da função discriminante (ver 
Tabela 5-13) são as três maiores, e todas excedem + 0,40, 
garantindo assim inclusão no processo de interpretação. 
Duas variáveis adicionais (X, e X,), porém, também têm 
cargas acima da referência + 0,40. A inclusão de X, não é 
inesperada, como era a quarta variável com efeito discri- 
minante univariado, mas não foi incluída na função dis- 
criminante devido à multicolinearidade (como mostrado 
no Capítulo 3, Análise Fatorial, onde X, e X,, formavam 
um fator). X,, porém, apresenta outra situação; ela não 
tinha um efeito univariado significante. A combinação 
das três variáveis na função discriminante criou um efeito 
que é associado com X,, mas X, não acrescenta qualquer 
poder discriminante adicional. Com relação a isso, X, é 
descritiva da função discriminante mesmo não sendo in- 
cluída nem tendo um efeito univariado significante. 


Interpretar a função discriminante e sua discriminação 
entre esses dois grupos exige que o pesquisador considere 
todas essas cinco variáveis. Na medida em que elas carac- 
terizam ou descrevem a função discriminante, todas re- 
presentam algum componente da mesma. 

Com as variáveis discriminantes identificadas e a função 
discriminante descrita em termos daquelas variáveis com 


Os três efeitos mais fortes na função discriminante, que 
são geralmente comparáveis com base nos valores de car- 
ga, são X,, (Preços competitivos), X,, (Flexibilidade de 
preço) e X,, (Linha do produto). X, (Atividades de co- 
mércio eletrônico) e o efeito de X, (Qualidade do produ- 
to) podem ser adicionados aos efeitos de X,,. Obviamente, 


diversos fatores diferentes estão sendo combinados para 
diferenciar entre os grupos, exigindo assim mais definição 
de perfil dos grupos para se entenderem as diferenças. 


cargas suficientemente elevadas, o pesquisador prossegue 
então para o perfil de cada grupo sobre essas variáveis 
para compreender as diferenças entre as mesmas. 


Perfil das variáveis discriminantes 

O pesquisador está interessado em interpretações das va- 
riáveis individuais que têm significância estatística e prá- 
tica. Tais interpretações são conseguidas primeiramente 
identificando-se as variáveis com substantivo poder dis- 
criminatório (ver a discussão anterior) e em seguida en- 
tendendo-se o que o grupo distinto diz cada variável in- 
dicada. 


Como descrito no Capítulo 1, escores maiores nas variá- 
veis independentes indicam percepções mais favoráveis 
da HBAT sobre aquele atributo (exceto para X,,, onde 
escores menores são preferíveis). Retornando à Tabela 
5-5, vemos diversos perfis entre os dois grupos sobre es- 
sas cinco variáveis. 


e O grupo O (clientes nos Estados Unidos/América do 
Norte) têm percepções maiores sobre três variáveis: X, 
(Qualidade do produto), X,;* (Preços competitivos) e 
X, (Linha do produto). 

e Ogrupo 1 (clientes fora da América do Norte) têm 
percepções maiores nas outras duas variáveis: X, (Ati- 
vidades de comércio eletrônico) e X,, (Flexibilidade de 
preço). 


Olhando esses dois perfis, podemos perceber que os 
clientes dos EUA/América do Norte têm percepções 
muito melhores dos produtos HBAT, enquanto os de- 
mais clientes se sentem melhor com questões sobre pre- 
ço e comércio eletrônico. Note que X, e X,,, ambas com 
percepções mais elevadas entre os clientes dos EUA/ 
América do Norte, formam o fator Valor do produto 
desenvolvido no Capítulo 3. A administração deveria 
usar esses resultados para desenvolver estratégias que 
acentuem esses pontos fortes e desenvolver outras van- 
tagens para fins de complementação. 

O perfil médio também ilustra a interpretação dos 
sinais (positivos e negativos) nos pesos e as cargas dis- 
criminantes. Os sinais refletem o perfil médio relativo 
dos dois grupos. Os sinais positivos, neste exemplo, são 
associados com variáveis que têm escores maiores para 
o grupo 1. Os pesos e cargas negativas são para aque- 
las variáveis com o padrão oposto (i.e., valores maiores 
no grupo 0). Logo, os sinais indicam o padrão entre os 
grupos. 


*N. de R. T.: A tabela indica o contrário, ou seja, a média de X,, é 
maior no grupo 1 (7,418 versus 5,600). 
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Estágio 6: Validação dos resultados 


O estágio final aborda a validade interna e externa da fun- 
ção discriminante. O principal meio de validação é pelo 
uso da amostra de validação e a avaliação de sua precisão 
preditiva. Desse modo, a validade é estabelecida se a fun- 
ção discriminante classifica, em um nível aceitável, obser- 
vações que não foram usadas no processo de estimação. 
Se a amostra de validação é obtida a partir da amostra 
original, então essa abordagem estabelece validade inter- 
na. Se uma outra amostra separada, talvez de uma outra 
população ou de outro segmento da população, forma a 
amostra de validação, então isso corresponde a uma vali- 
dação externa dos resultados discriminantes. 


Em nosso exemplo, a amostra de teste surge a partir da 
amostra original. Como anteriormente discutido, a preci- 
são de classificação (razões de sucesso) para as amostras 
de teste e de validação cruzada estava muito acima das 
referências em todas as medidas de precisão preditiva. 
Como tal, a análise estabelece validade interna. Para o 
propósito de validade externa, amostras adicionais de- 
vem ser extraídas de populações relevantes e a precisão 
de classificação deve ser avaliada em tantas situações 
quanto possível. 


O pesquisador é encorajado a estender o processo de 
validação por meio de perfis expandidos dos grupos e o 
possível uso de amostras adicionais para estabelecer a va- 
lidade externa. Idéias adicionais da análise de casos mal 
classificados podem sugerir variáveis extras que podem 
melhorar ainda mais o modelo discriminante. 


Uma visão gerencial 


A análise discriminante de clientes HBAT, baseada em 
localização geográfica (dentro ou fora da América do 
Norte), identificou um conjunto de diferenças em percep- 
ção que pode fornecer uma distinção mais sucinta e pode- 
rosa entre os dois grupos. Várias descobertas importantes 
incluem as seguintes: 


e Diferenças são encontradas em um subconjunto de ape- 
nas cinco percepções, o que permite uma concentração 
sobre as variáveis-chave, não tendo que se lidar com o 
conjunto inteiro. As variáveis identificadas como discri- 
minantes entre os grupos (listadas em ordem de impor- 
tância) são X,; (Preços competitivos), X,, (Flexibilidade 
de preço), X,, (Linha do produto), X, (Atividades de 
comércio eletrônico) e X, (Qualidade do produto). 

e Os resultados também indicam que as empresas loca- 
lizadas nos Estados Unidos têm melhores percepções 
da HBAT do que suas contrapartes internacionais em 
termos de valor e linha de produto, enquanto os clientes 
que não são norte-americanos têm uma percepção mais 
favorável sobre flexibilidade de preço e atividades de 


comércio eletrônico. Essas percepções podem resultar 
de uma maior similaridade entre compradores norte- 
americanos, enquanto clientes internacionais acham a 
política de preços em sintonia com suas necessidades. 

e Os resultados, que são altamente significantes, forne- 
cem ao pesquisador a habilidade de identificar correta- 
mente a estratégia de compra usada, com base nessas 
percepções, 85% do tempo. Esse elevado grau de con- 
sistência gera confiança no desenvolvimento de estraté- 
gias baseadas em tais resultados. 

e A análise das empresas mal classificadas revelou um pe- 
queno número de empresas que pareciam “deslocadas”. 
Identificar tais empresas pode identificar associações 
não tratadas por localização geográfica (p.ex. mercados 
no lugar de apenas localização física) ou outras caracte- 
rísticas de firmas ou de mercado que são associadas com 
localização geográfica. 


Portanto, conhecer a localização de uma firma dá 
idéias-chave sobre suas percepções da HBAT e, mais im- 
portante, como os dois grupos de clientes diferem, de for- 
ma que a administração pode empregar uma estratégia 
para acentuar as percepções positivas em suas negocia- 
ções com esses clientes e assim solidificar sua posição. 


UM EXEMPLO ILUSTRATIVO 
DE TRES GRUPOS 


Para ilustrar a aplicação de uma análise discriminante de 
três grupos, novamente usamos a base de dados HBAT. 
No exemplo anterior, estávamos interessados na discrimi- 
nação entre apenas dois grupos, de modo que conseguimos 
desenvolver uma única função discriminante e um escore 
de corte para dividir os dois grupos. No exemplo de três 
grupos, é necessário desenvolver duas funções discriminan- 
tes separadas para distinguir entre os três grupos. A pri- 
meira função separa um grupo dos outros dois, e a segunda 
separa os dois grupos restantes. Como no exemplo ante- 
rior, Os seis estágios do processo de construção do modelo 
são discutidos. 


Estágio 1: Objetivos da análise discriminante 


O objetivo da HBAT nessa pesquisa é determinar a relação 
entre as percepções que as empresas têm da HBAT e o pe- 
ríodo de tempo em que uma empresa é cliente de HBAT. 


Um dos paradigmas emergentes em marketing é o con- 
ceito de uma relação com cliente, baseada no estabeleci- 
mento de uma mútua parceria entre empresas ao longo 
de repetidas transações. O processo de desenvolvimento 
de uma relação implica a formação de metas e valores 
compartilhados, que devem coincidir com percepções 
melhoradas de HBAT. Portanto, a formação bem-suce- 
dida de uma relação deve ser entendida por meio de per- 
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cepções melhores de HBAT ao longo do tempo. Nessa 
análise, as firmas são agrupadas conforme sua situação 
como clientes HBAT. Se HBAT foi bem-sucedida no 
estabelecimento de relações com seus clientes, então as 
percepções sobre a HBAT irão melhorar em cada situa- 
ção como cliente HBAT. 


Estágio 2: Projeto de pesquisa 
para análise discriminante 


Para testar essa relação, uma análise discriminante é exe- 
cutada para estabelecer se existem diferenças em percep- 
ções entre grupos de clientes com base na extensão da 
relação de clientela. Se for o caso, a HBAT estará então 
interessada em ver se diferentes perfis justificam a propo- 
sição de que a HBAT teve sucesso no melhoramento de 
percepções entre clientes estabelecidos, um passo neces- 
sário na formação de relações com a clientela. 


Seleção de variáveis dependente e independentes 
Além das variáveis dependentes não-métricas (categóri- 
cas) definindo grupos de interesse, a análise discriminante 
também requer um conjunto de variáveis independentes 
métricas que são consideradas fornecedoras de base para 
discriminação ou diferenciação entre os grupos. 


Uma análise discriminante de três grupos é realizada 
usando X, (Tipo de cliente) como a variável dependente 
e as percepções de HBAT por parte dessas firmas (X, a 
X,s) como as variáveis independentes. Note que X, dife- 
re da variável dependente no exemplo de dois grupos no 
sentido de que ela tem três categorias nas quais classifi- 
car o tempo de permanência como cliente de HBAT (1 = 
menos que 1 ano,2=1 a 5 anos, e 3 = mais de 5 anos). 


Tamanho amostral e divisão da amostra 

Questões relativas ao tamanho da amostra são particular- 
mente importantes com análise discriminante devido ao 
foco não apenas no tamanho geral da amostra, mas tam- 
bém no tamanho amostral por grupo. Juntamente com a 
necessidade de uma divisão da amostra para obter uma 
amostra de validação, o pesquisador deve considerar cui- 
dadosamente o impacto da divisão amostral em termos do 
tamanho geral e do tamanho de cada um dos grupos. 


A base de dados da HBAT tem uma amostra de 100, a 
qual será novamente particionada em amostras de aná- 
lise e de validação de 60 e 40 casos, respectivamente. Na 
amostra de análise, a proporção de casos por variáveis 
independentes é quase 5:1, o limite inferior recomenda- 
do. Mais importante, na amostra de análise, apenas um 
grupo, com 13 observações, fica abaixo do nível reco- 
mendado de 20 casos por grupo. Apesar de o tamanho 


do grupo exceder 20 se a amostra inteira for usada na 
fase de análise, a necessidade de validação dita a criação 
da amostra de teste. Os três grupos são de tamanhos re- 
lativamente iguais (22, 13 e 25), evitando assim qualquer 
necessidade de igualar os tamanhos dos grupos. A análi- 
se procede com atenção para a classificação e interpreta- 
ção desse pequeno grupo de 13 observações. 


Estágio 3: Suposições da análise discriminante 


Como no caso do exemplo de dois grupos, as suposições 
de normalidade, linearidade e colinearidade das variáveis 
independentes já foram discutidas detalhadamente no Ca- 
pítulo 2. A análise feita no Capítulo 2 indicou que as va- 
riáveis independentes atendem essas suposições em níveis 
adequados para viabilizar a continuidade da análise sem 
ações corretivas adicionais. A suposição remanescente, a 
igualdade de matrizes de variância/covariância ou de dis- 
persão, também é abordada no Capítulo 2. 


O teste M de Box avalia a similaridade das matrizes de 
dispersão das variáveis independentes entre os três gru- 
pos (categorias). O teste estatístico indicou diferenças 
no nível de significância de 0,09. Neste caso, as diferen- 
ças entre grupos são não-significantes e nenhuma ação 
corretiva se faz necessária. Além disso, não se espera 
qualquer impacto sobre os processos de estimação e 
classificação. 


Estágio 4: Estimação do modelo 
discriminante e avaliação do ajuste geral 


Como no exemplo anterior, começamos nossa análise revi- 
sando as médias de grupo e os desvios-padrão para ver se os 
grupos são significantemente diferentes em alguma variável. 
Com essas diferenças em mente, empregamos em seguida 
um processo de estimação stepwise para obter as funções 
discriminantes e completamos o processo avaliando preci- 
são de classificação com diagnósticos gerais e por casos. 


Avaliação de diferenças de grupos 

Identificar as variáveis mais discriminantes com três ou 
mais grupos é mais problemático do que na situação com 
dois grupos. Para três ou mais grupos, as medidas típicas 
de significância para diferenças em grupos (ou seja, lamb- 
da de Wilks e o teste F) avaliam apenas as diferenças ge- 
rais e não garantem que cada grupo é significante em rela- 
ção aos demais. Assim, quando examinar variáveis quanto 
a suas diferenças gerais entre os grupos, certifique-se tam- 
bém de tratar das diferenças individuais de grupos. 


A Tabela 5-14 dá as médias de grupos, lambda de Wilks, 
razões F univariadas (ANOVAs simples) e Dº mínimo 
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de Mahalanobis para cada variável independente. A re- 


visão dessas medidas revela o seguinte: 


e Sobre uma base univariada, aproximadamente metade 
(7 entre 13) das variáveis exibe diferenças significantes 
entre as médias dos grupos. As variáveis com diferenças 
significantes incluem X,, No, X 1, Ma, Ko X 1 € Xp 

e Apesar de maior significância estatística corresponder 
a uma maior discriminação geral (ou seja, as variáveis 
mais significantes têm os menores lambdas de Wilks), 
ela nem sempre corresponde à maior discriminação en- 
tre todos os grupos. 

e A inspeção visual das médias dos grupos revela que 
quatro das variáveis com diferenças significantes 
(X 4, X o X, € X,5) diferenciam apenas um grupo 
versus os outros dois grupos [p.ex., X,, tem 
diferenças significantes somente nas médias entre o 
grupo 1 (3,059) versus grupos 2 (4,246) e 3 (4,288)]. 
Essas variáveis têm um papel limitado em análise 
discriminante por fornecerem discriminação apenas 
em um subconjunto de grupos. 

e Três variáveis (X,, X,e X,,) fornecem alguma 
discriminação, em vários graus, entre todos os grupos 
simultaneamente. Uma ou mais dessas variáveis 
podem ser usadas em combinação com as quatro 
variáveis precedentes para criar uma variável 
estatística com discriminação máxima. 

e O valor D de Mahalanobis fornece uma medida do 
grau de discriminação entre grupos. Para cada variável, 
o Dº mínimo de Mahalanobis é a distância entre os dois 
grupos mais próximos. Por exemplo, X,, tem o maior 
valor Dº e é a variável com as maiores diferenças entre 
todos os três grupos. Analogamente, X,,, uma variável 
com pequenas diferenças entre dois dos grupos, tem um 
pequeno valor D”. Com três ou mais grupos, o D' mí- 


nimo de Mahalanobis é importante na identificação da 
variável que dá a maior diferença entre os dois grupos 
mais parecidos. 


Todas essas medidas se combinam para ajudar a iden- 
tificar os conjuntos de variáveis que formam as funções 
discriminantes, como descritos na próxima seção. Quando 
mais de uma função é criada, cada uma fornece discrimi- 
nação entre conjuntos de grupos. No exemplo simples do 
início deste capítulo, uma variável discriminou entre os 
grupos 1 versus 2 e 3, sendo que a outra discriminou entre 
os grupos 2 versus 3 e 1. Esse é um dos principais benefí- 
cios que surgem do uso da análise discriminante. 


Estimação da função discriminante 

O procedimento stepwise é realizado da mesma manei- 
ra do exemplo de dois grupos, com todas as variáveis ini- 
cialmente excluídas do modelo. O procedimento então se- 
leciona a variável que tem uma diferença estatisticamente 
significante nos grupos enquanto maximiza a distância de 
Mahalanobis (D?) entre os dois grupos mais próximos. 
Desta maneira, variáveis estatisticamente significantes 
são selecionadas de modo a maximizarem a discriminação 
entre os grupos mais semelhantes em cada estágio. 

Este processo continua enquanto variáveis adicionais 
fornecerem discriminação estatisticamente significante 
além daquelas diferenças já explicadas pelas variáveis na 
função discriminante. Uma variável pode ser removida se 
alta multicolinearidade com variáveis independentes na 
função discriminante faz com que sua significância caia 
abaixo do nível para remoção (0,10). 


TABELA 5-14 Estatísticas descritivas de grupos e testes de igualdade para a amostra de estimação na análise discriminante de três grupos 


Médias de grupo da variável Teste de igualdade de Dº mínimo de 
dependente: X, Tipo de cliente médias de grupos” Mahalanobis 
Grupo 1:  Grupo2:1 Grupo 3: 
Menos que 1 abanos Mais de 5 Lambda Entre 
Variáveis independentes ano (n=22) (n=13) anos(n=25) deWilks ValorF Significância D' mínimo grupos 
X, Qualidade do produto 7,118 6,785 9,000 0,469 32,311 0,000 0,121 1e2 
X, Atividades de comércio ele- 3,514 3,754 3,412 0,959 1,221 0,303 0,025 1es 
trônico 
Xs Suporte técnico 4,959 5,615 5,976 0,973 0,782 0,462 0,023 2e3 
X, Solução de reclamação 4,064 5,900 6,300 0,414 40,292 0,000 0,205 2e3 
Xo Anúncio 3,745 4,277 3,768 0,961 1,147 0,325 0,000 1es 
X, Linha do produto 4,855 5,577 7,056 0,467 32,583 0,000 0,579 tez 
X,> Imagem da equipe de venda 4,673 5,346 4,836 0,943 1,708 0,190 0,024 1es3 
X, Preços competitivos 7,345 7,123 5,744 0,751 9,432 0,000 0,027 1e2 
X Garantia e reclamações 5,705 6,246 6,072 0,916 2,619 0,082 0,057 2e3 
Xjs Novos produtos 4,986 5,092 5,292 0,992 0,216 0,807 0,004 1e2 
Xe Encomenda e cobrança 3,291 4,715 4,700 0,532 25,048 0,000 0,000 2e3 
X; Flexibilidade de preço 4,018 5,508 4,084 0,694 12,551 0,000 0,005 1es 
X Velocidade de entrega 3,059 4,246 4,288 0,415 40,176 0,000 0,007 2e3 


“Lambda de Wilks (estatística U) e razão F univariada com 2 e 57 graus de liberdade. 
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Estimação stepwise: adição da primeira variável, 
X,- Os dados na Tabela 5-14 mostram que a primeira 
variável a entrar no modelo é X,, (Linha do produto), 
pois ela atende aos critérios para diferenças estatistica- 
mente significantes nos grupos e tem o maior valor D? (o 
que significa que ela tem a maior separação entre os dois 
grupos mais parecidos). 

Os resultados de adicionar X,, como a primeira va- 
riável no processo stepwise são mostrados na Tabela 
5-15. O ajuste geral do modelo é significante e todos os 
grupos são significantemente distintos, apesar de os gru- 
pos 1 (menos de um ano) e 2 (de um a cinco anos) terem 


a menor diferença entre eles (ver seção abaixo detalhan- 
do as diferenças de grupos). 

Com a menor diferença entre os grupos 1 e 2,0 pro- 
cedimento discriminante selecionará agora uma variável 
que maximiza aquela diferença enquanto pelo menos 
mantém as demais. Se voltarmos à Tabela 5-14, perce- 
beremos que quatro variáveis (X, Xe, X1; € X,) tinham 
diferenças significantes, com substanciais distinções en- 
tre os grupos 1 e 2. Olhando a Tabela 5-15, vemos que 
essas quatro variáveis têm o maior valor D” mínimo, e 
em cada caso é para a diferença entre os grupos 2 e 3 
(o que significa que os grupos 1 e 2 não são os mais pa- 


(Continua) 
TABELA 5-15 Resultados do passo 1 da análise discriminante stepwise de três grupos 
Ajuste geral do modelo 
Valor Valor F Graus de liberdade Significância 
Lambda de Wilks 0,467 32,583 2,57 0,000 
Variável adicionada/removida no passo 1 
F 

Variável adicionada Dº mínimo Valor Significância Entre grupos 

X,, Linha de produto 0,579 4,729 0,000 Menos de 1 ano e de 1 a 5 anos 


Nota: Em cada passo, a variável que maximiza a distância Mahalanobis entre os dois grupos mais próximos é adicionada. 


Variáveis na análise após o passo 1 


Variável Tolerância F para remover [Dá Entre grupos 
X, Linha de produto 1,000 NA NA 
NA = Não aplicável 
Variáveis fora da análise após o passo 1 

Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
Xe, Qualidade de produto 1,000 1,000 17,426 0,698 Menos de 1 ano e de 1 a 5 anos 
X, Atividades de comércio eletrônico 0,950 0,950 14,171 0,892 Menos de 1 ano e de 1 a 5 anos 
Xs Suporte técnico 0,959 0,959 0,733 0,649 Menos de 1 ano e de 1 a 5 anos 
X, Solução de reclamação 0,847 0,847 15,446 2,455 De 1 a 5 anos e mais de 5 anos 
Xo Anúncio 0,998 0,998 1,113 0,850 Menos de 1 ano e de 1 a 5 anos 
X, Imagem da equipe de venda 0,932 0,932 3,076 1,328 Menos de 1 ano e de 1 a 5 anos 
X;3 Preços competitivos 0,882 0,882 2,299 0,839 Menos de 1 ano e de 1a 5 anos 
X, Garantia e reclamações 0,849 0,849 0,647 0,599 Menos de 1 ano e de 1 a 5 anos 
X,s Novos produtos 0,993 0,993 0,415 0,596 Menos de 1 ano e de 1 a 5 anos 
X,. Encomenda e cobrança 0,943 0,943 12,176 2,590 De 1 a 5 anos e mais de 5 anos 
X, Flexibilidade de preço 0,807 0,807 17,300 3,322 De 1 a 5 anos e mais de 5 anos 
Xe Velocidade de entrega 0,773 0,773 19,020 2,988 De 1 a 5 anos e mais de 5 anos 


Teste de significância de diferenças de grupos após o passo 1º 


X, Tipo de cliente 


Menos de 1 ano De1a5anos 


De 1a5anos F 4,729 
Sig. 0,034 
Mais de 5 anos F 62,893 
Sig. 0,000 


20,749 
0,000 


* e 57 graus de liberdade. 
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preço) à função discriminante. A discriminação entre 


grupos aumentou, como refletido em um menor valor 
lambda de Wilks e no aumento do Dº mínimo (de 0,467 
para 0,288). As diferenças de grupos, geral e individuais, 
ainda são estatisticamente significantes. O acréscimo de 
X,, aumentou as distinções entre os grupos 1 e 2 consi- 
deravelmente, de forma que agora os dois grupos mais 
parecidos são 2 e 3. 

Das variáveis fora da equação, apenas X, (Qualidade 
de produto) satisfaz o nível de significância necessário 


recidos depois de acrescentar aquela variável). Assim, 
adicionar qualquer uma dessas variáveis afeta muito as 
diferenças entre os grupos 1 e 2, o par que era mais pa- 
recido depois que X,, foi adicionada no primeiro passo. 
O procedimento escolherá X,, porque ela criará a maior 
distância entre os grupos 2 e 3. 


Estimação stepwise: Adição da segunda variável, 
X,. A Tabela 5-16 detalha o segundo passo do proce- 
dimento stepwise: o acréscimo de X,, (Flexibilidade de 
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TABELA 5-16 Resultados do passo 2 da análise discriminante stepwise de três grupos 
Ajuste geral do modelo 
Valor Valor F Graus de liberdade Significância 
Lambda de Wilks 0,288 24,139 4,112 0,000 
Variável adicionada/removida no passo 2 
F 
Variável adicionada Dº mínimo Valor Significância Entre grupos 
X,; Flexibilidade de preço 3,322 13,958 0,000 De 1 a 5 anos e mais de 5 anos 
Nota: Em cada passo, a variável que maximiza a distância Mahalanobis entre os dois grupos mais próximos é adicionada. 
Variáveis na análise após o passo 2 
Variável Tolerância F para remover [Dá Entre grupos 
X, Linha de produto 0,807 39,405 0,005 Menos de 1 ano e mais de 5 anos 
X,; Flexibilidade de preço 0,807 17,300 0,579 Menos de 1 ano e de 1 a 5 anos 
Variáveis fora da análise após o passo 2 
Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
X, Qualidade de produto 0,730 0,589 24,444 6,071 Menos de 1 ano e de 1 a 5 anos 
X, Atividades de comércio eletrônico 0,880 0,747 0,014 3,327 Menos de 1 ano e de 1 a 5 anos 
X; Suporte técnico 0,949 0,791 1,023 3,655 Menos de 1 ano e de 1 a 5 anos 
X Solução de reclamação 0,520 0,475 3,932 3,608 Menos de 1 ano e de 1 a 5 anos 
Xo Anúncio 0,935 0,756 0,102 3,348 Menos de 1 ano e de 1 a 5 anos 
X,» Imagem da equipe de venda 0,884 0,765 0,662 3,342 Menos de 1 ano e de 1 a 5 anos 
X,s Preços competitivos 0,794 0,750 0,989 3,372 Menos de 1 ano e de 1 a 5 anos 
X, Garantia e reclamações 0,868 0,750 2,733 4,225 Menos de 1 ano e de 1 a 5 anos 
Xs Novos produtos 0,963 0,782 0,504 3,505 Menos de 1 ano e de 1 a 5 anos 
Xe Encomenda e cobrança 0,754 0,645 2,456 3,923 Menos de 1 ano e de 1 a 5 anos 
X, Velocidade de entrega 0,067 0,067 3,255 3,598 Menos de 1 ano e de 1 a 5 anos 


Teste de significância de diferenças de grupos após o passo 2º 


X, Tipo de cliente Menos de 1 ano De1a5anos 
De 1a5anos F 21,054 
Sig. 0,000 
Mais de 5 anos F 39,360 13,958 
Sig. 0,000 0,000 


22 e 56 graus de liberdade. 
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(Continuação) E 
para consideração. Se acrescentada, o D* mínimo será 


agora entre os grupos 1 e 2. 


Estimação stepwise: Adição das terceira e quarta variá- 
veis, X e X, Como anteriormente observado, X, se 
torna a terceira variável adicionada à função discrimi- 
nante. Depois que X, foi acrescentada, apenas X,, exibe 
uma significância estatística nos grupos (Nota: Os deta- 
lhes sobre o acréscimo de X, no terceiro passo não são 
mostrados por questão de espaço). 


A variável final adicionada no passo 4 é X,, (ver Ta- 
bela 5-17), com a função discriminante incluindo agora 
quatro variáveis (X,, X,, X, e X,;). O modelo geral é 
significante, com o lambda de Wilks diminuindo para 
0,127. Além disso, existem diferenças significantes entre 
todos os grupos individuais. 

Com essas quatro variáveis na função discriminante, 
nenhuma outra variável exibe a significância estatísti- 
ca necessária para inclusão, e o processo stepwise está 


(Continua) 


TABELA 5-17 Resultados do passo 4 da análise discriminante stepwise de três grupos 


Ajuste geral do modelo 


Valor Valor F 


Graus de liberdade Significância 


Lambda de Wilks 0,127 24,340 


8, 108 0,000 


Variável adicionada/removida no passo 4 


Variável adicionada Dº mínimo Valor 


Significância 


Entre grupos 


X, Velocidade de entrega 6,920 13,393 


0,000 Menos de 1 ano e de 1 a 5 anos 


Nota: Em cada passo, a variável que maximiza a distância Mahalanobis entre os dois grupos mais próximos é adicionada. 


Variáveis na análise após o passo 4 


Variável Tolerância F para remover D Entre grupos 
X, Linha de produto 0,075 0,918 6,830 Menos de 1 ano e de 1 a 5 anos 
X Flexibilidade de preço 0,070 1,735 6,916 Menos de 1 ano e de 1 a 5 anos 
X; Qualidade do produto 0,680 27,701 3,598 De 1 a 5 anos e mais de 5 anos 
X, Velocidade de entrega 0,063 5,387 6,071 Menos de 1 ano e de 1 a 5 anos 
Variáveis fora da análise após o passo 4 

Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
X, Atividades de comércio eletrônico 0,870 0,063 0,226 6,931 Menos de 1 ano e de 1 a 5 anos 
X, Suporte técnico 0,940 0,063 0,793 7,164 Menos de 1 ano e de 1 a 5 anos 
X, Solução de reclamação 0,453 0,058 0,292 7,019 Menos de 1 ano e de 1 a 5 anos 
Xo Anúncio 0,932 0,063 0,006 6,921 Menos de 1 ano e de 1 a 5 anos 
X,» Imagem da equipe de venda 0,843 0,061 0,315 7,031 Menos de 1 ano e de 1 a 5 anos 
X,; Preços competitivos 0,790 0,063 0,924 7,193 Menos de 1 ano e de 1 a 5 anos 
X,, Garantia e reclamações 0,843 0,063 2,023 7,696 Menos de 1 ano e de 1 a 5 anos 
X,s Novos produtos 0,927 0,062 0,227 7,028 Menos de 1 ano e de 1 a 5 anos 
X,, Encomenda e cobrança 0,671 0,062 1,478 7,210 Menos de 1 ano e de 1 a 5 anos 


Teste de significância de diferenças de grupos após o passo 4º 


X, Tipo de cliente 


Menos de 1 ano De1a5anos 


De 1a5anos F 13,393 
Sig. 0,000 
Mais de 5 anos F 56,164 
Sig. 0,000 


4 e 54 graus de liberdade. 


18,477 
0,000 
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(Continuação) 
concluído em termos de acréscimo de variáveis. Porém, 


o procedimento inclui também um exame da significân- 
cia de cada variável para que a mesma seja mantida na 
função discriminante. Neste caso, o “F para remover” 
para X, e X, é não-significante (0,918 e 1,735, respecti- 
vamente), indicando que uma ou ambas são candidatas 
para remoção da função discriminante. 


Estimação stepwise: Remoção de X, e X,. Quando 
X,s é adicionada ao modelo no quarto passo (ver a dis- 
cussão anterior), X,, tinha o menor valor “F para remo- 
ver” (0,918), fazendo com que o procedimento stepwise 
eliminasse aquela variável da função discriminante no 
quinto passo (detalhes sobre este passo 5 são omitidos 
por questões de espaço). Agora com três variáveis na 
função discriminante (X,,, X, e X,,), O ajuste geral do 
modelo ainda é significante e o lambda de Wilks aumen- 
tou só um pouco para 0,135. Todos os grupos são signifi- 
cantemente diferentes. Nenhuma variável atinge o nível 
necessário de significância estatística para ser adicionada 
à função discriminante, e mais uma variável (X,,*) tem 
um valor “F para remover” de 2,552, o que indica que 
ela também pode ser eliminada da função. 

A Tabela 5-18 contém os detalhes do passo 6 do 
procedimento stepwise, onde X,, também é removi- 
da da função discriminante, restando apenas X, e X,,. 
Mesmo com a remoção da segunda variável (X,,), O 
modelo geral ainda é significante e o lambda de Wilks 
é consideravelmente pequeno (0,148). Devemos obser- 
var que este modelo de duas variáveis, X, e X,, é um 
melhoramento em relação ao primeiro modelo de duas 
variáveis, X,, e X,,, formado no passo 2 (lambda de Wi- 
Iks é 0,148 contra o valor do primeiro modelo de 0,288 
e todas as diferenças individuais de grupos são muito 
maiores). Sem variáveis alcançando o nível necessário 
de significância para adição ou remoção, o procedimen- 
to stepwise é encerrado. 


Resumo do processo de estimação stepwise. As funções 
discriminantes estimadas são composições lineares se- 
melhantes a uma reta de regressão (ou seja, elas são uma 
combinação linear de variáveis). Assim como uma reta de 
regressão é uma tentativa de explicar a máxima variação 
em sua variável dependente, essas composições lineares 
tentam explicar as variações ou diferenças na variável ca- 
tegórica dependente. A primeira função discriminante é 
desenvolvida para explicar a maior variação (diferença) 
nos grupos discriminantes. A segunda função discrimi- 
nante, que é ortogonal e independente da primeira, ex- 
plica o maior percentual da variância remanescente (re- 
sidual) depois que a variância para a primeira função é 
removida. 


* N. de R. T.: Provavelmente trata-se de X,,, uma vez que X,, já fora 
removida. 


A informação fornecida na Tabela 5-19 resume os passos 
da análise discriminante de três grupos, com os seguintes 
resultados: 


e Xe X, são as duas variáveis na função discriminante fi- 
nal, apesar de X,, e X,, terem sido acrescentadas nos dois 
primeiros passos e então removidas depois que X, e X,s 
foram adicionadas. Os coeficientes não-padronizados e 
padronizados (pesos) da função discriminante e a matriz 
estrutural das cargas discriminantes, rotacionadas e não- 
rotacionadas, também foram fornecidos. A rotação das 
cargas discriminantes facilita a interpretação da mesma 
maneira que fatores foram simplificados para interpreta- 
ção via rotação (ver Capítulo 3 para uma discussão mais 
detalhada sobre rotação). Examinamos em pormenores 
as cargas rotacionadas e não-rotacionadas no passo 5. 

e A discriminação aumentou com a adição de cada variá- 
vel (como evidenciado pela diminuição no lambda de 
Wilks), mesmo com apenas duas variáveis restando no 
modelo final. Comparando o lambda de Wilks final para 
a análise discriminante (0,148) com o lambda de Wilks 
(0,414**) para o melhor resultado de uma única variável, 
X,**, vemos que uma melhora acentuada é obtida ao se 
usar exatamente duas variáveis nas funções discriminan- 
tes no lugar de uma única variável. 

e A qualidade de ajuste geral para o modelo discriminante 
é estatisticamente significante e ambas as funções são 
estatisticamente significantes também. A primeira função 
explica 91,5% da variância explicada pelas duas funções, 
com a variância remanescente (8,5% ) devida à segunda 
função. A variância total explicada pela primeira função 
é 0,893º, ou 79,7%. A próxima função explica 0,517 ou 
26,7% da variância remanescente (20,3%). Portanto, 

a variância total explicada por ambas as funções é de 
85,1% [79,7% + (26,7% x 0,203)] da variação total na 
variável dependente. 


Ainda que ambas as funções sejam estatisticamente 
significantes, o pesquisador sempre deve garantir que as 
funções discriminantes forneçam diferenças entre todos 
os grupos. É possível ter funções estatisticamente signi- 
ficantes, mas ter pelo menos um par de grupos que não 
sejam estatisticamente distintos (i.e., não discriminados 
entre eles). Este problema se torna especialmente predo- 
minante quando o número de grupos aumenta ou vários 
grupos pequenos são incluídos na análise. 


A última seção da Tabela 5-18 fornece os testes de signi- 
ficância para diferenças de grupos entre cada par de gru- 
pos (p.ex., grupo 1 versus grupo 2, grupo 1 versus grupo 
3 etc.). Todos os pares de grupos mostraram diferenças 
estatisticamente significantes, denotando que as funções 
discriminantes criaram separação não apenas em um 
sentido geral, mas também para cada grupo também. 
Examinamos os centróides de grupos graficamente em 
uma seção posterior. 


* N. de R. T.: Na verdade, seria X,, com lambda de Wilks igual a 0,467. 
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TABELA 5-18 Resultados do passo 6 da análise discriminante stepwise de três grupos 


Ajuste geral do modelo 


Valor Valor F Graus de liberdade Significância 
Lambda de Wilks 0,148 44,774 4,112 0,000 
Variável adicionada/removida no passo 6 
Variável removida Dº mínimo Valor Significância Entre grupos 
X, Linha do produto 6,388 25,642 0,000 Menos de 1 ano e de 1 a 5 anos 


Nota: Em cada passo, a variável que maximiza a distância Mahalanobis entre os dois grupos mais próximos é adicionada. 


Variáveis na análise após o passo 6 


Variável Tolerância F para remover [Dá Entre grupos 
X, Qualidade do produto 0,754 50,494 0,007 De 1 a 5 anos e mais de 5 anos 
X, Velocidade de entrega 0,754 60,646 0,121 Menos de 1 ano e de 1 a 5 anos 
Variáveis fora da análise após o passo 6 

Variável Tolerância Tolerância mínima F para entrar Dº mínimo Entre grupos 
X, Atividades de comércio eletrônico 0,954 0,728 0,177 6,474 Menos de 1 ano e de 1 a 5 anos 
X, Suporte técnico 0,999 0,753 0,269 6,495 Menos de 1 ano e de 1 a 5 anos 
X, Solução de reclamação 0,453 0,349 0,376 6,490 Menos de 1 ano e de 1 a 5 anos 
Xo Anúncio 0,954 0,742 0,128 6,402 Menos de 1 ano e de 1 a 5 anos 
X Linha do produto 0,701 0,529 2,552 6,916 Menos de 1 ano e de 1 a 5 anos 
X,, Imagem da equipe de venda 0,957 0,730 0,641 6,697 Menos de 1 ano e de 1 a 5 anos 
X,3 Preços competitivos 0,994 0,749 1,440 6,408 Menos de 1 ano e de 1 a 5 anos 
X, Garantia e reclamações 0,991 0,751 0,657 6,694 Menos de 1 ano e de 1 a 5 anos 
X, Novos produtos 0,984 0,744 0,151 6,428 Menos de 1 ano e de 1 a 5 anos 
X,. Encomenda e cobrança 0,682 0,514 2,397 6,750 Menos de 1 ano e de 1 a 5 anos 
X, Flexibilidade de preço 0,652 0,628 3,431 6,830 Menos de 1 ano e de 1 a 5 anos 
Teste de significância de diferenças de grupos após o passo 6º 
X, Tipo de cliente Menos de 1 ano De1a5Sanos 
De 1abanos F 25,642 

Sig. 0,000 
Mais de 5 anos Fi 110,261 30,756 
Sig. 0,000 0,000 


26 e 52 graus de liberdade. 


Avaliação da precisão de classificação 

Como esse é um modelo de análise discriminante de três 
grupos, duas funções discriminantes são calculadas para 
discriminar entre os três grupos. Valores para cada caso 
são inseridos no modelo discriminante e composições li- 
neares (escores Z discriminantes) são calculadas. As fun- 
ções discriminantes são baseadas somente nas variáveis 
incluídas no modelo discriminante. 


A Tabela 5-19 fornece os pesos discriminantes de am- 
bas as variáveis (X, e X,,) e as médias de cada grupo em 


ambas as funções (parte inferior da tabela). Como po- 
demos ver examinando as médias de grupos, a primeira 
função distingue o grupo 1 (Menos de 1 ano) dos outros 
dois grupos (apesar de uma sensível diferença ocorrer 
entre os grupos 2 e 3 também), enquanto a segunda fun- 
ção separa o grupo 3 (Mais de 5 anos) dos outros dois. 
Portanto, a primeira função fornece a maior separação 
entre todos os três grupos, mas é complementada pela 
segunda função, a qual melhor discrimina (1 e 2 versus 
3) onde a primeira função é mais fraca. 
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TABELA 5-19 Estatísticas resumo para análise discriminante de três grupos 


Ajuste geral do modelo: funções discriminantes canônicas 


Percentual de variância 


Função Percentual Correlação Lambda de 


Função Autovalor (%) cumulativo canônica Wilks Qui-quadrado df Significância 
3,950 91,5 91,5 0,893 0,148 107,932 4 0,000 
2 0,365 8,5 100,0 0,517 0,733 17,569 1 0,000 


Coeficientes da função discriminante e da função de classificação 
FUNÇÃO DISCRIMINANTE 


Função discriminante Função discriminante 
não-padronizada padronizada Funções de classificação 
Menos de De1abs Acima de 
Variáveis independentes Função 1 Função 2 Função 1 Função 2 1 ano anos 5 anos 
Xe Encomenda e cobrança* 0,308 1,159 0,969 0,622 14,382 15,510 18,753 
X, Velocidade de entrega 2,200 0,584 1,021 —0,533 25,487 31,185 34,401 
(Constante) —10,832 —11,313 -91,174 —120,351 —159,022 


Matriz estrutural 


a 


Cargas discriminantes não-rotacionadas Cargas discriminantes rotacionadas” 


Variáveis independentes Função 1 Função 2 Função 1 Função 2 
X Solução de reclamação* 0,572 —0,470 0,739 0,039 
Xe Encomenda e cobrança 0,499 —0,263 0,546 0,143 
X, Linha do produto* 0,483 —0,256 0,529 0,137 
X, Novos produtos* 0,125 —0,005 0,096 0,080 
X; Suporte técnico* 0,030 —0,017 0,033 0,008 
X Qualidade do produto* 0,463 0,886 —0,257 0,967 
X, Velocidade de entrega 0,540 —0,842 0,967 —0,257 
X, Flexibilidade de preço* 0,106 —0,580 0,470 —0,356 
X,o Anúncio* 0,028 -0,213 0,165 —0,138 
X, Atividades de comércio eletrônico* —0,095 -0,193 0,061 —0,207 
X,, Imagem da equipe de venda* —0,088 -0,188 0,061 —0,198 
X Garantia e reclamações” 0,030 —0,088 0,081 0,044 
X, Preços competitivos* —0,055 —0,059 —0,001 —0,080 


“Correlações internas de grupos entre variáveis discriminantes e variáveis de funções discriminantes canônicas padronizadas ordenadas por tamanho abso- 
luto da correlação dentro da função. 

"Correlações internas de grupos entre variáveis discriminantes e funções discriminantes canônicas padronizadas e rotacionadas. 

*Esta variável não é usada na análise. 


Médias de grupo (centróides) de funções discriminantes” 


X, Tipo de cliente Função 1 Função** 
Menos de 1 ano —1,911 —1,274 
De 1a5anos 0,597 —0,968 
Mais de 5 anos 1,971 1,625 


“Funções discriminantes canônicas não-padronizadas avaliadas nas médias de grupos. 


Avaliação da precisão preditiva de pertinência a grupo. O mesmo modo que se faz no modelo discriminante de dois 
passo final para avaliar o ajuste geral do modelo é deter- grupos, examinando-se as matrizes de classificação e o 
minar o nível de precisão preditiva da(s) função(ões) percentual corretamente classificado (razão de sucesso) 
discriminante(s). Essa determinação é conseguida do em cada amostra. 


*N. de RT.: Na realidade, foi incluída a variável X, (Qualidade do A classificação de casos individuais pode ser executada 
produto). pelo método de corte descrito no caso de dois grupos 
** N. de RT.: Neste caso, é Função 2. 
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ou usando as funções de classificação (ver Tabela 5-19) 
onde cada caso é computado em cada função de classifi- 
cação e classificado no grupo de maior escore. 

A Tabela 5-20 mostra que as duas funções discri- 
minantes em combinação atingem um grau elevado de 
precisão de classificação. A proporção de sucesso para 
a amostra de análise é de 86,7%. No entanto, a razão de 
sucesso para a amostra de teste cai para 55,0%. Esses 
resultados demonstram o viés ascendente que é típico 
quando se aplica somente à amostra de análise, mas não 
a uma amostra de validação. 

Ambas as proporções de sucesso devem ser compa- 
radas com os critérios de chance máxima e de chance 
proporcional para se avaliar sua verdadeira efetividade. 
O procedimento de validação cruzada é discutido no 
passo 6. 


e Ocritério de chance máxima é simplesmente a pro- 
porção de sucesso obtida se designarmos todas as ob- 
servações para o grupo com a maior probabilidade de 
ocorrência. Na presente amostra de 100 observações, 32 


0,334) e um valor de referência de 41,7% (33,4% x 1.25 

= 41,7%). 

As proporções de sucesso para as amostras de aná- 
lise e de teste (86,7% e 55,0%, respectivamente) exce- 
dem ambos os valores de referência de 43,74% e 41,7%. 
Na amostra de estimação, todos os grupos individuais 
ultrapassam os dois valores de referência. Na amostra 
de teste, porém, o grupo 2 tem uma razão de sucesso de 
somente 40,9%, e aumenta apenas para 53,8% na amos- 
tra de análise. Tais resultados mostram que o grupo 2 
deve ser o foco no melhoramento da classificação, pos- 
sivelmente com a adição de variáveis independentes ou 
uma revisão da classificação de firmas neste grupo para 
identificar as características do mesmo que não estão re- 
presentadas na função discriminante. 

A medida final de precisão de classificação é o O de 
Press, calculado para as amostras de análise e de valida- 
ção. Ele testa a significância estatística de que a precisão 
de classificação é melhor do que o acaso (chance). 


160-(52x3)2 


estavam no grupo 1, 35 no grupo 2, e 33 no grupo 3. A DCD amadiuimadia = 76,8 
partir dessa informação, podemos ver que a probabili- 60(3-1) 
dade mais alta seria 35% (grupo 2). O valor de referên- E 2 
: : E o cálculo para a amostra de teste é 
cia para a chance máxima (35% x 1,25) é 43,74%. P 
e Ocritério de chance proporcional é calculado elevando- [40 - (22x ap 
x OQ de Press 1.2 = 8,45 
se ao quadrado as proporções de cada grupo, com um amostra de-validação 40(3-1) 
valor calculado de 33,36% (0,32? + 0,35? + 0,33? = eai 
oniinua 
TABELA 5-20 Resultados de classificação para a análise discriminante de três grupos 
Resultados de classificação” 
Pertinência prevista em grupo 
Grupo real Menos do que 1 ano De1ia5anos Mais de 5 anos Total 
Amostra de estimação Menos de 1 ano 21 1 0 22 
95,5 4,5 0,0 
De 1a5anos 2 7 4 13 
15,4 583,8 30,8 
Mais de 5 anos 0 j 24 25 
0,0 4,0 96,0 
Validação cruzada Menos de 1 ano 21 À 0 22 
95,5 4,5 0,0 
De 1a5anos 2 7 4 13 
15,4 53,8 30,8 
Mais de 5 anos 0 1 24 25 
0,0 4,0 96,0 
Amostra de validação Menos de 1 ano 5 3 2 10 
50,0 30,0 20,0 
De 1abanos 1 9 12 22 
4,5 40,9 54,5 
Mais de 5 anos 0 0 8 8 
0,0 0,0 100,0 


86,7% dos casos agrupados originais selecionados corretamente classificados. 
"55,0% dos casos agrupados originais não-selecionados corretamente classificados. 
“86,7% dos casos agrupados selecionados e validados por cruzamento corretamente classificados. 
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(Continuação) 
Como o valor crítico em um nível de significância 


de 0,01 é 6,63, a análise discriminante pode ser descri- 
ta como prevendo pertinência a grupo melhor do que o 
acaso. 


Quando completado, podemos concluir que o mode- 
lo discriminante é válido e tem níveis adequados de sig- 
nificância estatística e prática para todos os grupos. Os 
valores consideravelmente menores para a amostra de 
validação em todos os padrões de comparação, contudo, 
justificam a preocupação levantada anteriormente sobre 
as razões de sucesso específicas de grupos e geral. 


Diagnósticos por casos 

Além das tabelas de classificação mostrando resultados 
agregados, informação específica de casos também está 
disponível detalhando a classificação de cada observação. 
Essa informação pode detalhar as especificidades do pro- 
cesso de classificação ou representar a classificação atra- 
vés de um mapa territorial. 


Informação de classificação específica de caso. Uma sé- 
rie de medidas específicas de casos está disponível para 
identificação dos casos mal classificados, bem como o 
diagnóstico da extensão de cada classificação ruim. Usan- 
do essa informação, padrões entre os mal classificados po- 
dem ser identificados. 


A Tabela 5-21 contém dados adicionais de classificação 
para cada caso individual que foi mal classificado (in- 
formação similar também está disponível para todos os 
outros casos, mas foi omitida por problemas de espaço). 
Os tipos básicos de informação de classificação incluem 
o que se segue: 


e Pertinência a grupo. Tanto os grupos reais quanto os 
previstos são exibidos para identificar cada tipo de má 
classificação (p.ex., pertinência real ao grupo 1, mas pre- 
vista no grupo 2). Neste caso, vemos os 8 casos mal clas- 
sificados na amostra de análise (verifique acrescentando 
os valores fora da diagonal na Tabela 5-20) e os 18 casos 
mal classificados na amostra de validação. 

e Distância de Mahalanobis ao centróide de grupo previsto. 
Denota a proximidade desses casos mal classificados em 
relação ao grupo previsto. Algumas observações, como o 
caso 10, obviamente são semelhantes às observações do 
grupo previsto e não do grupo real. Outras observações, 
como o caso 57 (distância de Mahalanobis de 6,041), são 
possivelmente observações atípicas no grupo previsto e 
no grupo real. O mapa territorial discutido na próxima 
seção retrata graficamente a posição de cada observação 
e auxilia na interpretação das medidas de distância. 

e Escores discriminantes. O escore Z discriminante para 
cada caso em cada função discriminante fornece uma 
maneira de comparação direta entre casos e um posicio- 
namento relativo versus as médias de grupos. 


e Probabilidade de classificação. Derivada do emprego 
das funções discriminantes de classificação, a probabili- 
dade de pertinência para cada grupo é dada. Os valores 
de probabilidade viabilizam ao pesquisador avaliar a 
extensão da má classificação. Por exemplo, dois casos, 
85 e 89, são do mesmo tipo de má classificação (grupo 
real 2 e grupo previsto 3), mas muito diferentes em suas 
classificações quando as probabilidades são focadas. O 
caso 85 representa uma classificação ruim marginal, pois 
a probabilidade de previsão no grupo real 2 era de 0,462, 
enquanto no grupo 3 incorretamente previsto ela era 
um pouco maior (0,529). Esta má classificação contrasta 
com o caso 89, onde a probabilidade do grupo real era 
de 0,032, e a probabilidade prevista para o grupo 3 (o 
mal classificado) era 0,966. Em ambas as situações de má 
classificação, a extensão ou magnitude varia muito. 


O pesquisador deve avaliar a extensão de má classifi- 
cação para cada caso. Casos que são classificações obvia- 
mente ruins devem ser escolhidos para análise adicional 
(perfil, exame de variáveis adicionais etc.), discutida na 
análise de dois grupos. 


Mapa territorial. A análise de más classificações pode 
ser suplementada pelo exame gráfico das observações in- 
dividuais, representando-as com base em seus escores Z 
discriminantes. 


A Figura 5-9 mostra cada observação baseada em seus 
dois escores Z discriminantes rotacionados com uma co- 
bertura do mapa territorial que representa as fronteiras 
dos escores de corte para cada função. Ao ver a disper- 
são de cada grupo em torno do centróide, podemos ob- 
servar várias coisas: 


e Ogrupo3 (Mais de 5 anos) é mais concentrado, com 
pouca sobreposição com os outros dois grupos, como se 
mostra na matriz de classificação onde apenas uma ob- 
servação foi mal classificada (ver Tabela 5-20). 

e Ogrupo 1 (Menos de 1 ano) é o menos compacto, mas o 
domínio de casos não se sobrepõe em grande grau com 
os outros grupos, tornando previsões muito melhores 
do que poderia ser esperado para um grupo tão variado. 
Os únicos casos mal classificados que são substancial- 
mente distintos são o caso 10, que é próximo ao centrói- 
de do grupo 2, e o caso 13, que é próximo ao centróide 
do grupo 3. Ambos os casos merecem melhor investiga- 
ção quanto às suas similaridades com outros grupos. 

e Estes dois grupos fazem contraste com o grupo 2 (De 
1a5 anos), que pode ser visto como tendo substancial 
sobreposição com o grupo 3 e, em menor extensão, com 
o grupo 1 (Menos de 1 ano). Essa sobreposição resulta 
nos mais baixos níveis de precisão de classificação nas 
amostras de análise e de teste. 

e A sobreposição que ocorre entre os grupos 2 e 3 no 
centro e à direita no gráfico sugere a possível existência 
de um quarto grupo. Uma análise poderia ser levada 

(Continua) 
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TABELA 5-21 Previsões mal classificadas para casos individuais na análise discriminante de três grupos 
PERTINÊNCIA A . 
GRUPO ESCORES DISCRIMINANTES PROBABILIDADE DE CLASSIFICAÇÃO 
Distância de 
Identificação Mahalanobis 
do caso (X)Real Previsto ao centróide Função 1 Função 2 Grupo 1 Grupo 2 Grupo 3 
Amostra de análise/estimação 
10 1 2 0,175 0,81755 —1,32387 0,04173 0,93645 0,02182 
8 2 1 1,747 —0,78395 —1,96454 0,75064 0,24904 0,00032 
100 2 1 2,820 —0,70077 —0,11060 0,54280 0,39170 0,06550 
1 2 3 2,947 —0,07613 0,70175 0,06527 0,28958 0,64515 
5 2 3 3,217 —0,36224 1,16458 0,05471 0,13646 0,80884 
37 2 3 3,217 —0,36224 1,16458 0,05471 0,13646 0,80884 
88 2 3 2,390 0,99763 0,12476 0,00841 0,46212 0,52947 
58 3 2 0,727 0,30687 —0,16637 0,07879 0,70022 0,22099 
Amostra de teste/validação 
25 1 2 1,723 —0,18552 -2,02118 0,40554 0,59341 0,00104 
77 1 2 0,813 0,08688 —0,22477 0,13933 0,70042 0,16025 
97 1 2 1,180 —0,41466 —0,57343 0,42296 0,54291 0,03412 
13 1 3 0,576 1,77156 2,26982 0,00000 0,00184 0,99816 
96 1 3 3,428 —0,26535 0,75928 0,09917 0,27855 0,62228 
83 2 1 2,940 —1,58531 0,40887 0,89141 0,08200 0,02659 
23 2 3 0,972 0,61462 0,99288 0,00399 0,10959 0,88641 
34 2 3 1,717 0,86996 0,41413 0,00712 0,31048 0,68240 
39 2 3 0,694 1,59148 0,82119 0,00028 0,08306 0,91667 
41 2 3 2,220 0,30230 0,58670 0,02733 0,30246 0,67021 
42 2 3 0,210 1,08081 1,97869 0,00006 0,00665 0,99330 
55 2 3 1,717 0,86996 0,41413 0,00712 0,31048 0,68240 
57 2 3 6,041 3,54521 0,47780 0,00000 0,04641 0,95359 
62 2 3 4,088 —0,32690 0,52743 0,17066 0,38259 0,44675 
75 2 3 2,947 —0,07613 0,70175 0,06527 0,28958 0,64515 
78 2 Ke) 0,210 1,08081 1,97869 0,00006 0,00665 0,99330 
85 2 3 2,390 0,99763 0,12476 0,00841 0,46212 0,52947 
89 2 3 0,689 0,54850 1,51411 0,00119 0,03255 0,96625 


“Distância de Mahalanobis ao centróide do grupo previsto 
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a cabo para determinar o real intervalo de tempo de 
clientes, talvez com clientes com mais de 1 ano divididos 
em três grupos ao invés de dois. 


A representação gráfica é útil não apenas para identi- 
ficar esses casos mal classificados que podem formar um 
novo grupo, mas também para identificar observações atí- 
picas. A discussão anterior indica possíveis opções para 
identificar observações atípicas (caso 57), bem como a 
possibilidade de redefinição de grupos entre os grupos 2 
es. 


Estágio 5: Interpretação dos resultados 
da análise discriminante de três grupos 


O próximo estágio da análise discriminante envolve uma sé- 
rie de passos na interpretação das funções discriminantes. 


e Calcular as cargas para cada função e rever a rotação das 
funções para fins de simplificação da interpretação. 

e Examinar as contribuições das variáveis preditoras: (a) a 
cada função separadamente (ou seja, cargas discriminan- 
tes), (b) cumulativamente sobre múltiplas funções discri- 
minantes com o índice de potência, e (c) graficamente em 
uma solução bidimensional para entender a posição relativa 
de cada grupo e a interpretação das variáveis relevantes na 
determinação dessa posição. 


Cargas discriminantes e suas rotações 

Uma vez que as funções discriminantes são calculadas, 
elas são correlacionadas com todas as variáveis indepen- 
dentes, mesmo aquelas não usadas na função discriminan- 
te, para desenvolver uma matriz estrutural (de cargas). 
Tal procedimento nos permite ver onde a discriminação 
ocorreria se todas as variáveis independentes fossem in- 
cluídas no modelo (ou seja, se nenhuma fosse excluída por 
multicolinearidade ou falta de significância estatística). 
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FIGURA 5-9 Mapa territorial para a análise discriminante de três grupos. 


Cargas discriminantes. As cargas não-rotacionadas re- 
presentam a associação de cada variável independente 
com cada função, mesmo que não esteja incluída na fun- 
ção discriminante. Cargas discriminantes, semelhantes às 
cargas fatoriais descritas no Capítulo 3, são as correla- 
ções entre cada variável independente e o escore discri- 
minante. 


A Tabela 5-19 contém a matriz estrutural de cargas não- 
rotacionadas para ambas as funções discriminantes. Se- 
lecionando variáveis com cargas de 0,40 ou acima como 
descritivas das funções, percebemos que a função 1 tem 
cinco variáveis excedendo 0,40 (AX, X,g Xi X € No), 
enquanto quatro variáveis são descritivas da função 2 
(X o Xig Xy € X). Ainda que pudéssemos usar essas 
variáveis para descrever cada função, enfrentaríamos o 
problema de que três variáveis (X,, X, e X,,) têm car- 
gas duplas (variáveis selecionadas como descritivas de 
ambas as funções). Se fôssemos proceder com as cargas 
não-rotacionadas, cada função compartilharia mais va- 
riáveis com a outra do que teria feito se fosse única. 


A falta de distinção das cargas com cada variável des- 
critiva de uma só função pode ser abordada com rotação 
da matriz estrutural, exatamente como foi feito com car- 
gas fatoriais. Para uma descrição mais detalhada do pro- 
cesso de rotação, ver Capítulo 3. 


Rotação Depois que as cargas da função discriminante 
são calculadas, elas podem ser rotacionadas para redis- 
tribuir a variância (esse conceito é melhor explicado no 
Capítulo 3). Basicamente, a rotação preserva a estrutura 


original e a confiabilidade dos modelos discriminantes e 
facilita consideravelmente a sua interpretação. 


Na presente aplicação, escolhemos o procedimento mais 
amplamente usado de rotação VARIMAX. A rotação 
afeta os coeficientes da função e as cargas discriminan- 
tes, bem como o cálculo dos escores Z discriminantes e 
dos centróides de grupo (ver Tabela 5-19). Examinar os 
coeficientes ou as cargas rotacionados versus não-rota- 
cionados revela um conjunto de resultados um pouco 
mais simples (ou seja, as cargas tendem a se separar em 
valores altos versus baixos, em vez de se limitarem a um 
domínio intermediário). As cargas rotacionadas permi- 
tem interpretações muito mais distintas de cada função: 


e A função 1 é agora descrita por três variáveis (X ,; X 
e X,.) que formam o fator Serviço ao Cliente de Pós- 
Venda durante a análise fatorial (ver Capítulo 3 para 
mais detalhes), mais X,, € X,,. Assim, o serviço a clien- 
te, mais linha de produto e flexibilidade de preço são 
descritores da função 1. 

e A função 2 mostra apenas uma variável, X, (Qualidade 
do produto), que tem uma carga acima de 0,40 para a 
segunda função. Apesar de X,, ter um valor abaixo da 
referência (-0,356), esta variável tem uma carga maior 
na primeira função, o que a torna um descritor daquela 
função. Logo, a segunda função pode ser descrita pela 
variável de Qualidade do produto. 


Com duas ou mais funções estimadas, a rotação pode 
ser uma poderosa ferramenta que sempre deve ser consi- 
derada para aumentar a interpretabilidade dos resultados. 
Em nosso exemplo, cada uma das variáveis que entrou no 
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processo stepwise era descritiva de uma das funções discri- 
minantes. O que devemos fazer agora é avaliar o impacto 
de cada variável em termos da análise discriminante geral 
(i.e., em ambas as funções). 


Avaliação da contribuição de variáveis preditoras 
Tendo descrito as funções discriminantes em termos das 
variáveis independentes — tanto aquelas que foram usa- 
das nas funções discriminantes quanto as que não foram 
incluídas — voltamos nossa atenção para conseguir uma 
melhor compreensão do impacto das próprias funções, e 
então das variáveis individuais. 


Impacto das funções individuais. A primeira tarefa é 
examinar as funções discriminantes em termos de como 
elas diferenciam entre os grupos. 


Começamos examinando os centróides de grupos quan- 
to às duas funções como mostrado na Tabela 5-19. Uma 
abordagem mais fácil é através do mapa territorial (Fi- 
gura 5-9): 


e Examinando os centróides de grupos e a distribuição 
de casos em cada grupo, percebemos que a função 1 
prioritariamente diferencia entre o grupo 1 e os grupos 
2e3, enquanto a função 2 distingue entre o grupo 3 e os 
grupos 1 e 2. 

e A sobreposição e a má classificação dos casos dos 
grupos 2 e 3 pode ser tratada via o exame da força das 
funções discriminantes e dos grupos diferenciados por 
conta de cada uma. Retomando a Tabela 5-19, a função 
1 era, de longe, o discriminador mais potente, e ela prio- 
ritariamente separava o grupo 1 dos demais. A função 2, 
que separava o grupo 3 dos outros, era muito mais fraca 
em termos de poder discriminante. Não é surpresa que 
a maior sobreposição e má classificação ocorreriam en- 
tre os grupos 2 e 3, que são distinguidos principalmente 
pela função 2. 


Essa abordagem gráfica ilustra as diferenças nos gru- 
pos devido às funções discriminantes, mas não fornece 
uma base para explicar essas diferenças em termos das 
variáveis independentes. 

Para avaliar as contribuições das variáveis individuais, 
o pesquisador conta com várias medidas — cargas discri- 
minantes, razões F univariadas e o índice de potência. As 
técnicas envolvidas no uso de cargas discriminantes e de 
razões F univariadas foram discutidas no exemplo de dois 
grupos. Examinaremos mais detalhadamente o índice de 
potência, um método de avaliação da contribuição de uma 
variável em múltiplas funções discriminantes. 


Índice de potência. O índice de potência é uma técnica 
adicional de interpretação muito útil em situações com 
mais de uma função discriminante. Ele retrata a contribui- 
ção de cada variável individual em todas as funções discri- 
minantes em termos de uma única medida comparável. 


O índice de potência reflete tanto as cargas de cada 
variável quanto o poder discriminatório relativo de cada 
função. As cargas rotacionadas representam a correlação 
entre a variável independente e o escore Z discriminan- 
te. Assim, a carga ao quadrado é a variância na variável 
independente associada com a função discriminante. Pon- 
derando a variância explicada de cada função via poder 
discriminatório relativo da função e somando nas funções, 
o índice de potência representa o efeito discriminante to- 
tal de cada variável ao longo de todas as funções discrimi- 
nantes. 


A Tabela 5-22 fornece os detalhes do cálculo do índice 
de potência para cada variável independente. A com- 
paração das variáveis quanto a seus índices de potência 
revela o seguinte: 


e X, (Velocidade de entrega) é a variável independente 
responsável pela maior discriminação entre os três tipos 
de grupos de clientes. 

e Fla é seguida em termos de impacto por quatro variá- 
veis não incluídas na função discriminante (X,, Xe X 
e Xy). 

e A segunda variável na função discriminante (X,) tem 
apenas o sexto maior valor de potência. 


Por que X, tem somente o sexto maior valor de po- 
tência mesmo sendo uma das duas variáveis incluídas na 
função discriminante? 


e Primeiro, lembre-se que multicolinearidade afeta solu- 
ções stepwise devido à redundância entre variáveis alta- 
mente multicolineares. X, e X,, eram as duas variáveis 
altamente associadas com X,, (formando o fator Serviço 
a Clientes), e assim seu impacto em um sentido univa- 
riado, refletido no índice de potência, não era neces- 
sário na função discriminante devido à presença de X,,. 

e As outras duas variáveis, X, e X,,, entraram através 
do procedimento stepwise, mas foram removidas uma 
vez que X, foi adicionada, novamente devido à multi- 
colinearidade. Assim, seu maior poder discriminante 
está refletido em seus valores de potência ainda que 
elas não fossem necessárias na função discriminante, 
uma vez que X, foi acrescentada com X,, na função 
discriminante. 

e Finalmente, X,, a segunda variável na função discrimi- 

nante, tem um baixo valor de potência por ser associada 

com a segunda função discriminante, que tem relativa- 
mente pouco impacto discriminante quando comparada 
com a primeira função. Logo, a despeito de X, ser um 
elemento necessário na discriminação entre os três gru- 
pos, seu impacto geral é menor do que aquelas variáveis 
associadas com a primeira função. 


Lembre-se que os valores de potência podem ser cal- 
culados para todas as variáveis independentes, mesmo 
que não estejam nas funções discriminantes, pois eles são 
baseados em cargas discriminantes. A meta do índice de 
potência é fornecer interpretação naqueles casos onde 
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multicolinearidade ou outros fatores possam ter evitado a 
inclusão de uma variável na função discriminante. 


Uma visão geral das medidas empíricas de impacto. 
Como visto nas discussões anteriores, o poder discrimi- 
natório de variáveis em análise discriminante é refletido 
em muitas medidas diferentes, cada uma desempenhando 
um papel único na interpretação dos resultados discrimi- 
nantes. Combinando todas essas medidas em nossa ava- 
liação das variáveis, podemos conquistar uma perspectiva 
bastante eclética sobre como cada variável se ajusta nos 
resultados discriminantes. 


A Tabela 5-23 apresenta as três medidas interpretativas 
preferidas (cargas rotacionadas, razão F univariada e ín- 
dice de potência) para cada variável independente. Os 
resultados apóiam a análise stepwise, apesar de ilustra- 
rem em diversos casos o impacto de multicolinearidade 
sobre os procedimentos e os resultados. 


e Duas variáveis (X, e X,,) têm os maiores impactos indi- 
viduais como evidenciado por seus valores F univaria- 
dos. No entanto, como ambas são altamente associadas 
(como evidenciado por suas inclusões no fator Serviço 
ao cliente do Capítulo 3), apenas uma será incluída em 
uma solução stepwise. Ainda que X, tenha um valor F 
univariado marginalmente maior, a habilidade de X,, 
fornecer uma melhor discriminação entre todos os gru- 
pos (como evidenciado por seu maior valor mínimo D? 
de Mahalanobis descrito anteriormente) fez dela a me- 
lhor candidata para inclusão. Portanto, X,, em uma base 
individual, tem um poder discriminante comparável, mas 
X, será vista funcionando melhor com outras variáveis. 

e Três variáveis adicionais (X,, X, e X,,) são as próximas 
com maior impacto, mas apenas uma, X,, é mantida na 
função discriminante. Note que X,, é altamente correla- 
cionada com X,, (ambas parte do fator Serviço ao clien- 


te) e não incluída na função discriminante, enquanto X,, 
entrou na mesma, mas foi uma daquelas variáveis remo- 
vidas depois que X, foi adicionada. 

e Finalmente, duas variáveis (X,, e X,;) tinham quase os 
mesmos efeitos univariados, mas somente X,, tinha uma 
associação substancial com uma das funções discrimi- 
nantes (uma carga de 0,470 sobre a primeira função). O 
resultado é que mesmo que X,, possa ser considerada 
descritiva da primeira função e tendo um impacto na 
discriminação baseado nessas funções, X,, não tem 
qualquer impacto, seja em associação com essas duas 
funções, seja em adição uma vez que estas funções sejam 
explicadas. 

e Todas as variáveis remanescentes tinham pequenos 
valores F univariados e pequenos valores de potência, o 
que indica pouco ou nenhum impacto tanto no sentido 
univariado quanto multivariado. 


De particular interesse é a interpretação das duas di- 
mensões de discriminação. Essa interpretação pode ser 
feita somente através do exame das cargas, mas é comple- 
mentada por uma representação gráfica das cargas discri- 
minantes, como descrito na próxima seção. 


Representação gráfica de cargas discriminantes. Para 
representar as diferenças em termos das variáveis pre- 
ditoras, as cargas e os centróides de grupos podem ser 
representados graficamente em espaço discriminante re- 
duzido. Como observado anteriormente, a representação 
mais válida é o uso de vetores de atribuição e centróides 
de grupos expandidos. 


A Tabela 5-24 mostra os cálculos para a expansão das 
cargas discriminantes (usadas para vetores de atribui- 


ção) e de centróides de grupos. O processo de represen- 
(Continua) 


TABELA 5-23 Resumo de medidas interpretativas para análise discriminante de três grupos 


Cargas rotacionadas de 
função discriminante 


Razão F Índice de 

Função 1 Função 2 univariada potência 
X Qualidade do produto —0,257 0,967 32,311 0,139 
X, Atividades de comércio eletrônico 0,061 —0,207 1,221 0,060 
X; Suporte técnico 0,033 0,008 0,782 0,001 
X Solução de reclamação 0,739 0,039 40,292 0,500 
Xo Anúncio 0,165 -0,138 1,147 0,027 
X, Linha do produto 0,529 0,137 32,583 0,258 
X,» Imagem da equipe de venda 0,061 -0,198 1,708 0,007 
X, Preços competitivos —0,001 —0,080 9,432 0,001 
X Garantia e reclamações 0,081 0,044 2,619 0,006 
Xs Novos produtos 0,096 0,080 0,216 0,009 
Xe Encomenda e cobrança 0,546 0,143 25,048 0,275 
X Flexibilidade de preço 0,470 —0,356 12,551 0,213 
Xs Velocidade de entrega 0,967 —0,257 40,176 0,861 
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tação gráfica sempre envolve todas as variáveis incluídas 
no modelo pelo procedimento stepwise (em nosso exem- 
plo, X, e X,;). No entanto, também faremos o gráfico 
das variáveis não incluídas na função discriminante se 
suas respectivas razões F univariadas forem significan- 
tes, o que adiciona X,, X, e X,, ao espaço discriminante 
reduzido. Esse procedimento mostra a importância de 
variáveis colineares que não foram incluídas no modelo 
stepwise final, semelhante ao índice de potência. 

Os gráficos dos vetores de atribuição expandidos 
para as cargas discriminantes rotacionadas são exibidos 
na Figura 5-10. Os vetores do gráfico nos quais esse pro- 
cedimento foi usado apontam para os grupos que têm a 
mais alta média na respectiva variável independente e 
para a direção oposta dos grupos que têm os mais baixos 
escores médios. Assim, a interpretação do gráfico na Fi- 
gura 5-10 indica o seguinte: 


e Como observado no mapa territorial e na análise dos 
centróides de grupos, a primeira função discriminante 
distingue entre grupo 1 e grupos 2 e 3, enquanto a se- 
gunda diferencia o grupo 3 dos grupos 1 e 2. 

e A correspondência de X,,, X,; X, € X, com o eixo X 
reflete a associação delas com a primeira função discri- 
minante, enquanto vemos que somente X, é associada 
com a segunda função discriminante. A figura ilustra 
graficamente as cargas rotacionadas para cada função e 
distingue as variáveis descritivas de cada função. 


Estágio 6: Validação dos 
resultados discriminantes 


As razões de sucesso para as matrizes de classificação cru- 
zada e de teste podem ser usadas para avaliar a validade 
interna e externa, respectivamente, da análise discrimi- 
nante. Se as razões de sucesso excederem os valores de 
referência nos padrões de comparação, então validade é 
estabelecida. Como anteriormente descrito, os valores de 
referência são 41,7% para o critério de chance proporcio- 
nal e 43,7% para o critério de chance máxima. Os resulta- 
dos de classificação mostrados na Tabela 5-20 fornecem o 
seguinte suporte para validade: 

Validade interna é avaliada pelo método de classifica- 
ção cruzada, onde o modelo discriminante é estimado dei- 
xando um caso de fora e então prevendo aquele caso com 
o modelo estimado. Este processo é feito em turnos para 
cada observação, de modo que uma observação jamais in- 
fluencia o modelo discriminante que prevê sua classifica- 
ção em algum grupo. 


Como visto na Tabela 5-20, a razão de sucesso geral para 
o método de classificação cruzada de 86,7 substancialmen- 
te excede ambos os padrões, tanto geral quanto para cada 
grupo. Contudo, ainda que todos os três grupos também 
tenham razões individuais de sucesso acima dos padrões, 
a razão de sucesso do grupo 2 (53,8) é consideravelmente 
menor do que aquela sobre os outros dois grupos. 


TABELA 5-24 Cálculo dos vetores de atribuição e dos centróides de grupos expandidos no espaço discriminante reduzido 


Cargas da função discrimi- 


Coordenadas no 


nante rotacionada espaço reduzido 
Razão F 
Variáveis independentes Função 1 Função 2 univariada Função 1 Função 2 
X, Qualidade do produto —0,257 0,967 32,811 -8,308 31,244 
X, Atividades de comércio eletrônico” 0,061 —0,207 1,221 
X; Suporte técnico” 0,033 0,008 0,782 
X, Solução de reclamação 0,739 0,039 40,292 29,776 1,571 
Xjo Anúncio? 0,165 -0,138 1,147 
X, Linha do produto 0,529 0,137 32,583 17,236 4,464 
X, Imagem da equipe de venda” 0,061 —0,198 1,708 
X, Preços competitivos” —0,001 —0,080 9,432 
X, Garantia e reclamações” 0,081 0,044 2,619 
X, Novos produtos” 0,096 0,080 0,216 
Xe Encomenda e cobrança 0,546 0,143 25,048 13,676 3,581 
X, Flexibilidade de preço? 0,470 —0,356 12,551 
X Velocidade de entrega 0,967 —0,257 40,176 38,850 —10,325 
“Variáveis com razões univariadas não-significantes não são representadas no espaço reduzido. 
Coordenadas no 
Centróides de grupo Valor F aproximado espaço reduzido 
Função 1 Função 2 Função 1 Função 2 Função 1 Função 2 
Grupo 1: Menos de 1 ano —1,911 —1,274 66,011 56,954 —126,147 —72,559 
Grupo 2: De 1 a 5 anos 0,597 —0,968 66,011 56,954 39,408 -55,1931 
Grupo 3: Mais de 5 anos 1,371 1,625 66,011 56,954 90,501 92,550 
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FIGURA 5-10 Gráfico de vetores de atribuição expandidos (variáveis) no espaço discriminante reduzido. 


Validade externa é tratada através da amostra de tes- 
te, a qual é uma amostra completamente separada que 
utiliza as funções discriminantes estimadas com a amostra 
de análise para previsão de grupos. 


Em nosso exemplo, a amostra de teste tem uma ra- 
zão geral de sucesso de 55,0%, o que excede ambos 
os valores de referência, apesar de isso não ocorrer na 
magnitude encontrada na abordagem de classificação 
cruzada. O grupo 2, contudo, não excedeu qualquer 
valor de referência. Quando as classificações ruins são 
analisadas, percebemos que mais casos são mal classi- 
ficados no grupo 3 do que corretamente classificados 
no grupo 2, o que sugere que esses casos mal classi- 
ficados sejam examinados diante da possibilidade de 
uma redefinição dos grupos 2 e 3 para que se crie um 
novo grupo. 


O pesquisador também é encorajado a estender o 
processo de validação por meio do perfil dos grupos 
quanto a conjuntos adicionais de variáveis ou apli- 
cando a função discriminante em outra(s) amostra(s) 
representativa(s) da população geral ou de segmentos 
da mesma. Além disso, a análise de casos mal classifi- 
cados ajudará a estabelecer se são necessárias variáveis 
adicionais ou se a classificação de grupos dependentes 
precisa de revisão. 


Uma visão gerencial 


A análise discriminante teve por meta entender as dife- 
renças perceptuais de clientes com base nos intervalos de 
tempo como clientes da HBAT. Espera-se que o exame 
de diferenças em percepções HBAT baseadas na constân- 
cia como clientes identifique percepções que são críticas 


ao desenvolvimento de uma relação de clientela, o que é 
tipificado por aqueles clientes de longo prazo. Três grupos 
de clientela foram formados — menos de 1 ano, de 1 a 5 
anos, e mais de 5 anos — e as percepções quanto à HBAT 
foram medidas sobre 13 variáveis. A análise produziu di- 
versas descobertas importantes, tanto em termos dos tipos 
de variáveis que distinguiam entre os grupos quanto nos 
padrões de mudanças ao longo do tempo: 


e Primeiro, há duas dimensões de discriminação entre os 
três grupos de clientes. A primeira dimensão é tipificada 
por elevadas percepções de serviço aos clientes (Solu- 
ção de reclamação, Velocidade de entrega e Encomen- 
da e cobrança), juntamente com Linha do produto e 
Flexibilidade de preço. Em contraste, a segunda dimen- 
são é caracterizada somente em termos de Qualidade 
do produto. 

e O perfil dos três grupos quanto a essas duas dimensões 
e variáveis associadas com cada dimensão permite à 
gerência compreender as diferenças perceptuais entre 
eles. 

e O grupo 1, clientes há menos de 1 ano, geralmente 
tem as menores percepções da HBAT. Para as 
três variáveis de serviço à clientela (Solução de 
reclamação, Encomenda e cobrança, e Velocidade 
de entrega), esses clientes têm percepções menores 
do que em qualquer outro grupo. Para Qualidade 
de produto, Linha de produto e Preço competitivo, 
este grupo é comparável com o 2 (de 1 a 5 anos), mas 
ainda tem percepções menores do que clientes há 
mais de 5 anos. Somente para Flexibilidade de preço 
este grupo é comparável com os clientes mais antigos 
e ambos têm valores menores do que os clientes de 
1a5 anos. No geral, as percepções desses clientes 
mais recentes seguem o padrão esperado de serem 
menores do que outros da clientela, mas é esperado 
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que melhorem à medida que permanecerem clientes 
ao longo do tempo. 

e Ogrupo?2, clientes de 1 a 5 anos, tem semelhanças 
com os clientes mais novos e os mais antigos. 
Quanto às três variáveis de serviço à clientela, eles 
são comparáveis ao grupo 3 (mais de 5 anos). Para 
Qualidade de produto, Linha de produto e Preço 
competitivo, suas percepções são mais comparáveis 
com as dos clientes mais novos (e menores do que 
as dos clientes mais antigos). Eles mantêm as mais 
elevadas percepções, dos três grupos, quanto à 
Flexibilidade de preço. 

e Ogrupo3, representando os clientes há mais de 5 
anos, tem as mais favoráveis percepções da HBAT, 
como o esperado. Apesar de serem comparáveis 
aos clientes do grupo 2 quanto às três variáveis de 
serviço à clientela (com ambos os grupos maiores do 
que o grupo 1), eles são significantemente maiores 
que os clientes nos outros dois grupos em termos 
de Qualidade de produto, Linha de produto e 
Preço competitivo. Assim, este grupo representa 
aqueles clientes que têm percepções positivas e 
têm progredido no estabelecimento de uma relação 
cliente/HBAT através de um fortalecimento de suas 
percepções. 

e Usando os três grupos como indicadores no desenvolvi- 
mento de relações de clientela, podemos identificar dois 
estágios nos quais as percepções HBAT mudam nesse 
processo de desenvolvimento: 

e Estágio 1: O primeiro conjunto de percepções a 
mudar é aquele relacionado a serviços a clientes 
(visto nas diferenças entre os grupos 1 e 2). Este 
estágio reflete a habilidade da HBAT de afetar 
positivamente percepções com operações relativas a 
serviços. 

e Estágio 2: Um desenvolvimento de maior prazo é 
necessário para promover melhoras em elementos 
mais centrais (Qualidade de produto, Linha de 
produto e Preço competitivo). Quando ocorrem 
essas mudanças, o cliente deve se tornar mais 
comprometido com a relação, como se evidencia por 
uma longa permanência com a HBAT. 

e Deve ser observado que existe evidência de que vários 
clientes fazem a transição através do estágio 2 mais ra- 
pidamente do que os cinco anos, como mostrado pelo 
considerável número de clientes que têm sido do grupo 
entre 1 e 5 anos, ainda que mantenham as mesmas per- 
cepções da clientela mais antiga. Assim, HBAT pode 
esperar que certos clientes possam se deslocar através 
desse processo muito rapidamente, e uma análise mais 
detalhada sobre tais clientes pode identificar caracte- 
rísticas que facilitam o desenvolvimento de relações 
com a clientela. 


Assim, o gerenciamento leva em conta um input para 
planejamento estratégico e tático não apenas dos resul- 
tados diretos da análise discriminante, mas também dos 
erros de classificação. 


REGRESSÃO LOGÍSTICA: | 
REGRESSÃO COM UMA VARIÁVEL 
DEPENDENTE BINÁRIA 


Como discutimos, a análise discriminante é apropriada 
quando a variável dependente é não-métrica. No entanto, 
quando a variável dependente tem apenas dois grupos, a 
regressão logística pode ser preferida por duas razões: 


e A análise discriminante depende estritamente de se atende- 
rem as suposições de normalidade multivariada e de igual- 
dade entre as matrizes de variância-covariância nos grupos 
— suposições que não são atendidas em muitas situações. A 
regressão logística não depende dessas suposições rígidas e 
é muito mais robusta quando tais pressupostos não são sa- 
tisfeitos, o que torna sua aplicação apropriada em muitas 
situações. 

e Mesmo quando os pressupostos são satisfeitos, muitos pes- 
quisadores preferem a regressão logística por ser similar à 
regressão múltipla. Ela tem testes estatísticos diretos, tra- 
tamentos similares para incorporar variáveis métricas e 
não-métricas e efeitos não-lineares, e uma vasta gama de 
diagnósticos. 


Por essas e outras razões mais técnicas, a regressão lo- 
gística é equivalente à análise discriminante de dois gru- 
pos e pode ser mais adequada em muitas situações. 

Nossa discussão de regressão logística não cobre cada 
um dos seis passos do processo de decisão, mas destaca as 
diferenças e semelhanças entre a regressão logística e a 
análise discriminante ou a regressão múltipla. Para uma 
revisão completa de regressão múltipla, ver o Capítulo 4. 


Representação da variável dependente binária 


Em análise discriminante, o caráter não-métrico de uma 
variável dependente dicotômica é acomodado fazendo-se 
previsões de pertinência a grupo baseadas em escores Z 
discriminantes. Isso requer o cálculo de escores de corte e 
a designação de observações a grupos. 

A regressão logística aborda essa tarefa de uma ma- 
neira mais semelhante à encontrada em regressão múlti- 
pla. Regressão logística representa os dois grupos de inte- 
resse como uma variável binária com valores de 0 e 1. Não 
importa qual grupo é designado com o valor de 1 versus 
0, mas tal designação deve ser observada para a interpre- 
tação dos coeficientes. 


e Se os grupos representam características (p.ex., sexo), então 
um grupo pode ser designado com o valor 1 (p.ex., femini- 
no) e o outro grupo com o valor O (p.ex., masculino). Em tal 
situação, os coeficientes refletiriam o impacto das variáveis 
independentes sobre a probabilidade da pessoa ser do sexo 
feminino (ou seja, o grupo codificado como 1). 

e Se os grupos representam resultados ou eventos (p.ex., su- 
cesso ou fracasso, compra ou não-compra), a designação dos 
códigos de grupos causa impacto na interpretação também. 
Considere que o grupo com sucesso é codificado como 1, e 
aquele com fracasso, como 0. Então, os coeficientes repre- 
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sentam os impactos sobre a probabilidade de sucesso. De 
maneira igualmente fácil, os códigos poderiam ser inverti- 
dos (1 agora denota fracasso) e os coeficientes representa- 
riam as forças que aumentam a probabilidade de fracasso. 


A regressão logística difere da regressão múltipla, con- 
tudo, no sentido de que ela foi especificamente elaborada 
para prever a probabilidade de um evento ocorrer (ou seja, a 
probabilidade de uma observação estar no grupo codificado 
como 1). Apesar de os valores de probabilidade serem me- 
didas métricas, há diferenças fundamentais entre regressão 
múltipla e logística. 


Uso da curva logística 

Como a variável dependente tem apenas os valores 0 e 1, o 
valor previsto (probabilidade) deve ser limitado para cair 
dentro do mesmo domínio. Para definir uma relação limi- 
tada por O e 1, a regressão logística usa a curva logística 
para representar a relação entre as variáveis independen- 
tes e dependente (ver Figura 5-11). Em níveis muito bai- 
xos da variável independente, a probabilidade se aproxima 
de 0, mas nunca alcança tal valor. Analogamente, quan- 
do a variável independente aumenta, os valores previstos 
crescem para acima da curva, mas em seguida a inclina- 
ção começa a diminuir de modo que em qualquer nível da 
variável independente a probabilidade se aproximará de 
1,0, mas jamais excederá tal valor. Como vimos em nos- 
sas discussões sobre regressão, no Capítulo 4, os modelos 
lineares de regressão não podem acomodar tal relação, já 
que ela é inerentemente não-linear. A relação linear de re- 
gressão, mesmo com termos adicionais de transformações 
para efeitos não-lineares, não pode garantir que os valores 
previstos permaneçam no intervalo de 0 a 1. 


Natureza única da variável dependente 

A natureza binária da variável dependente (O ou 1) tem 
propriedades que violam as suposições da regressão múl- 
tipla. Primeiro, o termo de erro de uma variável discreta 
segue a distribuição binomial ao invés da normal, invali- 
dando assim todos os testes estatísticos que se sustentam 


1,0 p=-==========0 00.00... 


Probabilidade do evento 
(variável dependente) 


nas suposições de normalidade. Segundo, a variância de 
uma variável dicotômica não é constante, criando casos 
de heteroscedasticidade também. Além disso, nenhuma 
violação pode ser remediada por meio de transformações 
das variáveis dependente ou independentes. 

A regressão logística foi desenvolvida para lidar espe- 
cificamente com essas questões. Não obstante, sua relação 
única entre variáveis dependente e independentes exige 
uma abordagem um tanto diferente para estimar a variá- 
vel estatística, avaliar adequação de ajuste e interpretar os 
coeficientes, quando comparada com regressão múltipla. 


Estimação do modelo de regressão logística 


A regressão logística tem uma única variável estatística 
composta de coeficientes estimados para cada variável 
independente — como na regressão múltipla. Tal variável 
estatística é estimada de uma maneira diferente. A regres- 
são logística deriva seu nome da transformação logit usa- 
da com a variável dependente, criando diversas diferenças 
no processo de estimação (bem como o processo de inter- 
pretação discutido na próxima seção). 


Transformação da variável dependente 

Como mostrado anteriormente, o modelo logit usa a for- 
ma específica da curva logística, que é em forma de S para 
ficar no domínio de O a 1. Para estimar um modelo de re- 
gressão logística, essa curva de valores previstos é ajustada 
aos dados reais, exatamente como foi feito com uma rela- 
ção linear em regressão múltipla. No entanto, como os va- 
lores reais dos dados das variáveis dependentes podem ser 
somente 0 ou 1, o processo é de algum modo diferente. 


A Figura 5-12 retrata dois exemplos hipotéticos de ajus- 
te de uma relação logística aos dados da amostra. Os 
dados reais representam se um evento acontece ou não 
designando valores 1 ou O aos resultados (neste caso 1 é 


designado quando o evento ocorreu, O no caso contrário, 
(Continua) 
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FIGURA 5-11 


Nível da variável independente Alto 


Forma da relação logística entre variáveis dependente e independentes. 
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mas tal atribuição poderia facilmente ser invertida). Ob- 
servações são representadas pelos pontos no topo ou na 
base do gráfico. Esses resultados (que aconteceram ou 
não) ocorrem em cada valor da variável independente (o 
eixo X). Na parte (a), a curva logística não pode ajustar 
bem os dados porque há diversos valores da variável in- 
dependente que têm ambos os resultados (1 e 0). Neste 
caso, a variável independente não distingue entre os dois 
resultados, como se mostra na considerável sobreposi- 
ção dos dois grupos. 

No entanto, na parte (b), uma relação muito melhor 
definida está baseada na variável independente. Valores 
menores da variável independente correspondem às ob- 
servações com ( para a variável dependente, enquanto 
valores maiores correspondem bem àquelas observações 
com um valor 1 sobre a variável dependente. Assim, a 
curva logística deve ser capaz de ajustar bem os dados. 


Mas como prevemos pertinência a grupo a partir da 
curva logística? Para cada observação, a técnica de regres- 
são logística prevê um valor de probabilidade entre O e 
1. O gráfico dos valores previstos para todos os valores 
da variável independente gera a curva exibida na Figura 
5-12. Tal probabilidade prevista é baseada nos valores das 
variáveis independentes e nos coeficientes estimados. Se a 
probabilidade prevista é maior do que 0,50, então a pre- 
visão é de que o resultado seja 1 (o evento ocorreu); caso 
contrário, o resultado é previsto como sendo O (o even- 
to não ocorreu). Retornemos ao nosso exemplo para ver 
como isso funciona. 


Nas partes (a) e (b) da Figura 5-12, um valor de 6,0 para 
X (a variável independente) corresponde a uma proba- 
bilidade de 0,50. Na parte (a), podemos ver que diversas 
observações de ambos os grupos recaem em ambos os 


lados deste valor, resultando em diversas classificações 
(Continua) 


(a) Relação pobremente ajustada 
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FIGURA 5-12 


X 


Exemplos de ajuste da curva logística aos dados da amostra. 
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ruins. As classificações ruins são mais perceptíveis para 
o grupo com valores 1,0, ainda que diversas observações 
no outro grupo (variável dependente = 0,0) também se- 
jam mal classificadas. Na parte (b), fazemos classificação 
perfeita dos dois grupos quando usamos o valor de pro- 
babilidade de 0,50 como valor de corte. 


Logo, com uma curva logística estimada, podemos es- 
timar a probabilidade para qualquer observação com base 
em seus valores para as variáveis independentes e então 
prever a pertinência a grupo usando 0,50 como valor de 
corte. Uma vez que temos a pertinência prevista, podemos 
criar uma matriz de classificação exatamente como foi fei- 
to em análise discriminante e avaliar a precisão preditiva. 


Estimação dos coeficientes 

De onde vem a curva? Em regressão múltipla, estimamos 
uma relação linear que melhor ajusta os dados. Em re- 
gressão logística, seguimos o mesmo processo de previ- 
são da variável dependente por uma variável estatística 
composta dos coeficientes logísticos e as correspondentes 
variáveis independentes. No entanto, o que difere é que 
em regressão logística os valores previstos jamais podem 
estar fora do domínio de O a 1. Apesar de uma discussão 
completa sobre os aspectos conceituais e estatísticos en- 
volvidos no processo de estimação estar além do escopo 
deste texto, diversas fontes excelentes com tratamentos 
completos sobre tais aspectos estão disponíveis [3,15,17]. 
Podemos descrever o processo de estimação em dois pas- 
sos básicos à medida que introduzimos alguns termos co- 
muns e fornecemos uma breve visão geral do processo. 


Transformação de uma probabilidade em razão de desi- 
gualdade e valores logit. Como na regressão múltipla, a 
regressão logística prevê uma variável dependente métri- 
ca, neste caso valores de probabilidade restritos ao domí- 
nio entre O e 1. Mas como podemos garantir que valores 
estimados não recaiam fora desse domínio? A transfor- 
mação logística perfaz este processo em dois passos. 


Reestabelecimento de uma probabilidade como ra- 
zão de desigualdades. Em sua forma original, probabi- 
lidades não são restritas a valores entre 0 e 1. Portanto, o 
que aconteceria se reestabelecêssemos a probabilidade de 
uma maneira que a nova variável sempre ficasse entre O 
e 1? Fazemos isso expressando uma probabilidade como 
razão de desigualdades — a razão entre as probabilidades 
dos dois resultados ou eventos, Prob,/(1 — Prob,). Desta 
forma, qualquer valor de probabilidade é agora dado em 
uma variável métrica que pode ser diretamente estima- 
da. Qualquer razão de desigualdade pode ser convertida 
reciprocamente em uma probabilidade que fica entre O e 
1. Resolvemos nosso problema de restrição dos valores 
previstos entre O e 1 prevendo a razão de desigualdades e 
então convertendo a mesma em uma probabilidade. 


Usemos alguns exemplos da probabilidade de sucesso 
ou fracasso para ilustrar como a razão de desigualdades 
é calculada. Se a probabilidade de sucesso é 0,80, então 
sabemos também que a probabilidade do resultado alter- 
nativo (ou seja, o fracasso) é 0,20 (0,20 = 1,0 — 0,80). Esta 
probabilidade significa que as desigualdades de sucesso 
são 4,0 (0,80/0,20), ou que o sucesso é quatro vezes mais 
provável de acontecer do que o fracasso. Reciprocamen- 
te, podemos estabelecer as desigualdades de fracasso 
como 0,25 (0,20/0,80), ou, em outras palavras, o fracasso 
acontece a um quarto da taxa de sucesso. Assim, qual- 
quer que seja o resultado que busquemos (sucesso ou 
fracasso), podemos estabelecer a probabilidade como 
uma chance ou uma razão de desigualdades. 


Como você provavelmente já desconfiou, uma proba- 
bilidade de 0,50 resulta em razão de desigualdades de 1,0 
(ambos os resultados têm iguais chances de ocorrerem). 
Razão de desigualdades inferior a 1,0 representa proba- 
bilidades menores do que 0,50, e razão de desigualdades 
maior do que 1,0 corresponde a uma probabilidade maior 
do que 0,50. Agora temos uma variável métrica que sem- 
pre pode ser convertida de volta a uma probabilidade en- 
tre0 el. 


Cálculo do valor logit. A variável de razão de desi- 
gualdades resolve o problema de fazer estimativas de pro- 
babilidade entre O e 1, mas temos outro problema: como 
fazemos com que as razões de desigualdades fiquem abai- 
xo de 0, que é o limite inferior (não há limite superior). 
A solução é computar aquilo que é chamado de valor lo- 
git — calculado via logaritmo das razões de desigualdades. 
Razões menores que 1,0 têm um logit negativo, razões 
maiores que 1,0 têm valores logit positivos, e a razão de 
desigualdades igual a 1,0 (correspondente a uma proba- 
bilidade de 0,5) tem um valor logit de 0. Além disso, não 
importa o quão baixo o valor negativo fique, ele ainda 
pode ser transformado tomando-se o anti-logaritmo em 
uma razão de desigualdades maior que 0. O que se segue 
mostra alguns valores típicos de probabilidade e as razões 
de desigualdades correspondentes, bem como valores lo- 
garítmicos. 


Razão de Logaritmo 

Probabilidade desigualdades (Logit) 
0,00 0,00 NC 
0,10 0,111 2,197 
0,30 0,428 —0,847 
0,50 1,000 0,000 
0,70 2,333 0,847 
0,90 9,000 2,197 
1,00 NC NC 

NC = Não pode ser calculado 
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Com o valor logit, agora temos uma variável métrica 
que pode ter valores positivos e negativos, mas que sem- 
pre pode ser transformada de volta em um valor de pro- 
babilidade entre O e 1. Observe, no entanto, que o logit 
jamais pode realmente alcançar O ou 1. Esse valor agora 
se torna a variável dependente do modelo de regressão 
logística. 


Estimação do modelo. Uma vez que compreendemos 
como interpretar os valores das razões de desigualdades 
ou das medidas logit, podemos proceder com o uso delas 
como medida dependente em nossa regressão logística. 
O processo de estimação dos coeficientes logísticos é se- 
melhante àquele usado em regressão, apesar de que nes- 
te caso somente dois valores reais são empregados para 
a variável dependente (0 e 1). Além do mais, em vez de 
usar os mínimos quadrados ordinários como meio para 
estimar o modelo, o método de verossimilhança máxima 
é utilizado. 


Estimação dos coeficientes. Os coeficientes esti- 
mados para as variáveis independentes são estimados 
usando-se o valor logit ou a razão de desigualdades como 
medida dependente. Cada uma dessas formulações de 
modelo é exibida aqui: 


à POD, qo 
Logit-=n)——T— |=b+bX+.+bX 
i 1 b 0 q nn 
= pro: evento 
ou 
. , DEDO ato b+bX ++ X 
Razão de desigualdades, = — SE | tutti 
La POD, ento 


Ambas as formulações de modelo são equivalentes, 
mas aquela que for escolhida afetará a estimação dos co- 
eficientes. Muitos programas de computador fornecem 
os coeficientes logísticos em ambas as formas, de modo 
que o pesquisador deve entender como interpretar cada 
forma. Discutimos aspectos interpretativos em uma seção 
posterior. 

Este processo pode acomodar uma ou mais variáveis 
independentes, e estas podem ser métricas ou não-métri- 
cas (binárias). Como vemos adiante em nossa discussão 
sobre interpretação dos coeficientes, ambas as formas dos 
mesmos refletem a direção e a magnitude da relação, mas 
são interpretadas de maneiras distintas. 


Uso da máxima verossimilhança para estima- 
ção. Regressão múltipla emprega o método de mínimos 
quadrados, que minimiza a soma das diferenças quadradas 
entre os valores reais e previstos da variável dependente. 
A natureza não-linear da transformação logística requer 
que outro procedimento, o da máxima verossimilhança, 


seja usado de maneira iterativa para que se encontrem as 
estimativas mais prováveis para os coeficientes. No lugar 
de minimizar os desvios quadrados (mínimos quadrados), 
a regressão logística maximiza a probabilidade de que 
um evento ocorra. O valor de probabilidade, ao invés da 
soma de quadrados, é em seguida usado quando se calcula 
uma medida de ajuste geral do modelo. Usar esta técnica 
alternativa de estimação também demanda que avaliemos 
o ajuste do modelo de diferentes maneiras. 


Avaliação da qualidade do ajuste 
do modelo de estimação 


A qualidade de ajuste para um modelo de regressão lo- 
gística pode ser avaliada de duas maneiras. Uma é a ava- 
liação de ajuste usando valores “pseudo” R”, semelhantes 
aqueles encontrados em regressão múltipla. A segunda 
abordagem é examinar precisão preditiva (como a matriz 
de classificação em análise discriminante). As duas técni- 
cas examinam ajuste de modelo sob diferentes perspecti- 
vas, mas devem conduzir a conclusões semelhantes. 


Ajuste de estimação do modelo 

A medida básica do quão bem o procedimento de esti- 
mação de máxima verossimilhança se ajusta é o valor de 
verossimilhança, semelhante aos valores das somas de 
quadrados usadas em regressão múltipla. Regressão logís- 
tica mede o ajuste da estimação do modelo com o valor —2 
vezes o logaritmo do valor da verossimilhança, chamado 
de -2LL ou -2log verossimilhança. O valor mínimo para 
-2LL é 0, o que corresponde a um ajuste perfeito (veros- 
similhança = 1 e -2LL é então 0). Assim, quanto menor 
o valor -2LL, melhor o ajuste do modelo. Como será dis- 
cutido na próxima seção, o valor -2LL pode ser usado 
para comparar equações quanto à variação no ajuste ou 
ser utilizado para calcular medidas comparáveis ao Rº em 
regressão múltipla. 


Entre comparações de modelos. O valor de verossimi- 
lhança pode ser comparado entre equações para avaliar a 
diferença em ajuste preditivo de uma equação para outra, 
com testes estatísticos para a significância dessas diferen- 
ças. O método básico segue três passos: 


1. Estimar um modelo nulo. O primeiro passo é calcular um 
modelo nulo, que atua como a referência para fazer com- 
parações de melhoramento no ajuste do modelo. O modelo 
nulo mais comum é um sem variáveis independentes, que 
é semelhante a calcular a soma total de quadrados usando 
somente a média em regressão múltipla. A lógica por trás 
desta forma de modelo nulo é que ele pode atuar como uma 
referência em relação à qual qualquer modelo contendo va- 
riáveis independentes pode ser comparado. 

2. Estimar o modelo proposto. Este modelo contém as variá- 
veis independentes a serem incluídas no modelo de regres- 
são logística. Espera-se que o ajuste melhorará em relação 
ao modelo nulo e que resulte em um valor menor de -2LL. 
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Qualquer número de modelos propostos pode ser estimado 
(p.ex., modelos com uma, duas e três variáveis independen- 
tes podem ser propostas distintas). 

3. Avaliar a diferença -2LL. O passo final é avaliar a signifi- 
cância estatística do valor -2LL entre os dois modelos (nulo 
versus proposto). Se os testes estatísticos suportam diferen- 
ças significantes, então podemos estabelecer que o conjunto 
de variáveis independentes no modelo proposto é signifi- 
cante na melhora do ajuste da estimação do mesmo. 


De maneira semelhante, comparações também po- 
dem ser feitas entre dois modelos propostos quaisquer. 
Em tais casos, a diferença -2LL reflete a diferença em 
ajuste de modelo devido a distinções de especificações. 
Por exemplo, um modelo com duas variáveis indepen- 
dentes pode ser comparado com um modelo de três va- 
riáveis independentes para que se avalie a melhora pelo 
acréscimo de uma variável. Nesses casos, um modelo é 
escolhido para atuar como nulo e então é comparado 
com outro. 


Por exemplo, considere que queremos testar a signifi- 
cância de um conjunto de variáveis independentes cole- 
tivamente para ver se elas melhoram o ajuste do modelo. 
O modelo nulo seria especificado como um modelo sem 
essas variáveis, e o modelo proposto incluiria as variá- 
veis a serem avaliadas. A diferença em -2LL significaria 
a melhora a partir do conjunto de variáveis independen- 
tes. Poderíamos fazer testes similares das diferenças em 
-2LL entre outros pares de modelos variando o número 
de variáveis independentes incluídas em cada um. 


O teste do qui-quadrado e o teste associado para sig- 
nificância estatística são usados para se avaliar a redução 
no logaritmo do valor de verossimilhança. No entanto, 
esses testes estatísticos são particularmente sensíveis a ta- 
manho de amostra (para amostras pequenas é mais difícil 
mostrar significância estatística, e vice-versa para grandes 
amostras). Portanto, pesquisadores devem ser particular- 
mente cuidadosos ao tirarem conclusões com base apenas 
na significância do teste do qui-quadrado em regressão 
logística. 


Medidas pseudo Rº. Além dos testes qui-quadrado, 
diversas medidas do tipo Rº foram desenvolvidas e são 
apresentadas em vários programas estatísticos para repre- 
sentarem ajuste geral do modelo. Essas medidas pseudo 
Rº são interpretadas de uma maneira parecida com o co- 
eficiente de determinação em regressão múltipla. Um va- 
lor pseudo R” pode ser facilmente obtido para regressão 
logística semelhante ao valor R em análise de regressão 
[6]. O pseudo Rº para um modelo logit (ai) pode ser 
calculado como 


2 e 
LOGIT 


2 Laio E (2 LLáeto ) 
2 LL, RA 


Exatamente como na contraparte da regressão múl- 
tipla, o valor Rº logit varia de 0,0 a 1,0. À medida que o 
modelo proposto aumenta o ajuste, o -2LL diminui. Um 
ajuste perfeito tem um valor de -2LL igual a 0,0 e um 
Rca de LO: 

Duas outras medidas são semelhantes ao valor pseudo 
Rº e são geralmente categorizadas também como medidas 
pseudo R”. A medida Rº de Cox e Snell opera do mes- 
mo modo, com valores maiores indicando maior ajuste do 
modelo. No entanto, esta medida é limitada no sentido de 
que não pode atingir o valor máximo de 1, de forma que 
Nagelkerke propôs uma modificação que tinha o domínio 
de O a 1. Essas duas medidas adicionais são interpretadas 
como refletindo a quantia de variação explicada pelo mo- 
delo logístico, com 1,0 indicando ajuste perfeito. 


Uma comparação com regressão múltipla. Ao discutir 
os procedimentos para avaliação de ajuste de modelo em 
regressão logística, fazemos várias referências a similari- 
dades com regressão múltipla em termos de diversas me- 
didas de ajuste. Na tabela a seguir, mostramos a corres- 
pondência entre conceitos usados em regressão múltipla e 
suas contrapartes em regressão logística. 


Correspondência de elementos primários de 
ajuste de modelo 


Regressão múltipla Regressão logística 
Soma total de quadrados -2LL do modelo base 
Soma de quadrados do erro -2LL do modelo proposto 


Soma de quadrados da Diferença de -LL* para 


regressão modelos base e proposto 
Teste F de ajuste de mo- |. Teste de qui-quadrado da 
delo diferença -2LL 
Coeficiente de determina- Medidas pseudo Rº 

ção (Rº) 


Como podemos ver, os conceitos de regressão múltipla 
e regressão logística são semelhantes. Os métodos básicos 
para testar ajuste geral do modelo são comparáveis, com 
as diferenças surgindo dos métodos de estimação nas duas 
técnicas. 


Precisão preditiva 

Assim como emprestamos o conceito de Rº da regressão 
como uma medida de ajuste geral de modelo, podemos pro- 
curar na análise discriminante a medida de precisão prediti- 
va geral. As duas técnicas mais comuns são a matriz de clas- 
sificação e as medidas de ajuste baseadas no qui-quadrado. 


Matriz de classificação. Esta técnica de matriz de classi- 
ficação é idêntica àquela usada em análise discriminante, 
ou seja, medir o quão bem a pertinência a grupo é prevista 
e desenvolver uma razão de sucesso. O caso da regressão 


* N. de R. T.: A frase correta seria “Diferença de —2LL”. 
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logística sempre incluirá somente dois grupos, mas todas 
as medidas relacionadas a chances (p.ex., chance máxima, 
chance proporcional ou Q de Press) usadas anteriormente 
são aplicáveis aqui também. 


Medida baseada no qui-quadrado. Hosmer e Lemeshow 
[11] desenvolveram um teste de classificação no qual os 
casos são primeiramente divididos em aproximadamen- 
te 10 classes iguais. Em seguida, os números de eventos 
reais e previstos são comparados em cada classe com a 
estatística qui-quadrado. Esse teste fornece uma medida 
ampla de precisão preditiva que é baseada não no valor 
de verossimilhança, mas sim na real previsão da variável 
dependente. O uso apropriado desse teste requer um ta- 
manho de amostra de pelo menos 50 casos para garantir 
que cada classe tenha pelo menos cinco observações e ge- 
ralmente até mesmo uma amostra maior, uma vez que o 
número de eventos previstos nunca fica abaixo de 1. Além 
disso, a estatística qui-quadrado é sensível a tamanho da 
amostra, permitindo assim que essa medida encontre di- 
ferenças muito pequenas, estatisticamente significantes, 
quando o tamanho da amostra se torna grande. 

Tipicamente examinamos tantas dessas medidas de 
ajuste de modelo quanto possível. Espera-se que uma con- 
vergência de indicações dessas medidas forneça o suporte 
necessário ao pesquisador para a avaliação do ajuste geral 
do modelo. 


Teste da significância dos coeficientes 


A regressão logística testa hipóteses sobre coeficientes in- 
dividuais, como se faz na regressão múltipla. Em regressão 
múltipla, o teste estatístico era para ver se o coeficiente era 
significantemente diferente de 0. Um coeficiente nulo indi- 
ca que o mesmo não tem impacto sobre a variável depen- 
dente. Em regressão logística, usamos também um teste 
estatístico para ver se o coeficiente logístico é diferente de 
0. Lembre, contudo, que em regressão logística usando o 
logit como medida dependente, um valor de O corresponde 
à razão de desigualdade de 1,00 ou uma probabilidade de 
0,50 — valores que indicam que a probabilidade é igual para 
cada grupo (i.e., novamente nenhum efeito da variável in- 
dependente sobre a previsão de pertinência ao grupo). 

Em regressão múltipla, o valor t é utilizado para ava- 
liar a significância de cada coeficiente. Regressão logística 
usa uma estatística diferente, a estatística Wald. Ela provê 
a significância estatística para cada coeficiente estimado de 
forma que testes de hipóteses podem ocorrer exatamente 
como se faz em regressão múltipla. Se o coeficiente logísti- 
co é estatisticamente significante, podemos interpretá-lo em 
termos de como o mesmo impacta a probabilidade estimada 
e consequentemente a previsão de pertinência a grupo. 


Interpretação dos coeficientes 


Uma das vantagens da regressão logística é que precisa- 
mos saber apenas se um evento (compra ou não, risco de 


crédito ou não, falência de empresa ou sucesso) ocorreu 
ou não para definir um valor dicotômico como nossa va- 
riável dependente. No entanto, quando analisamos es- 
ses dados usando transformação logística, a regressão e 
seus coeficientes assumem um significado algo diferente 
daqueles encontrados na regressão com uma variável de- 
pendente métrica. Analogamente, cargas discriminantes 
de uma análise discriminante de dois grupos são interpre- 
tadas diferentemente a partir de um coeficiente logístico. 

A partir do processo de estimação descrito anterior- 
mente, sabemos que os coeficientes (B,, B,, B,, ..., B,) 
são na verdade medidas das variações na proporção das 
probabilidades (as razões de desigualdades). No entanto, 
coeficientes logísticos são difíceis de interpretar em sua 
forma original, pois eles são expressos em termos de lo- 
garitmos quando usamos o logit como a medida depen- 
dente. Assim, a maioria dos programas de computador 
fornece também um coeficiente logístico exponenciado, 
que é apenas uma transformação (anti-logaritmo) do co- 
eficiente logístico original. Desse modo, podemos usar os 
coeficientes logísticos originais ou exponenciados para a 
interpretação. Os dois tipos de coeficientes logísticos dife- 
rem no sentido da relação da variável independente com 
as duas formas da dependente, como mostrado aqui: 


Coeficiente logístico Reflete mudanças em... 

Original Logit (logaritmo da razão 
de desigualdades) 

Exponenciado Razão de desigualdades 


Discutimos na próxima seção como cada forma do 
coeficiente reflete direção e magnitude da relação da va- 
riável independente, mas requer diferentes métodos de 
interpretação. 


Direção da relação 

A direção da relação (positiva ou negativa) reflete as mu- 
danças na variável dependente associadas com mudanças 
na independente. Uma relação positiva significa que um 
aumento na variável independente é associado com um 
aumento na probabilidade prevista, e vice-versa para uma 
relação negativa. Veremos que a direção da relação é re- 
fletida diferentemente nos coeficientes logísticos original 
e exponenciado. 


Interpretação da direção de coeficientes originais. O si- 
nal dos coeficientes originais (positivo ou negativo) indica 
a direção da relação, como foi visto nos coeficientes de 
regressão. Um valor positivo aumenta a probabilidade, 
enquanto um negativo diminui a mesma, pois os coefi- 
cientes originais são expressos em termos de valores logit, 
onde um valor de 0,0 corresponde a um valor de razão de 
desigualdade de 1,0 e uma probabilidade de 0,50. Assim, 
números negativos são relativos a razões de desigualdades 
menores que 1,0 e probabilidades menores que 0,50. 
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Interpretação da direção de coeficientes exponenciados. 
Coeficientes exponenciados devem ser interpretados di- 
ferentemente, pois eles são os logaritmos dos coeficientes 
originais. Considerando o logaritmo, estamos na verdade 
estabelecendo o coeficiente exponenciado em termos de 
razões de desigualdades, o que significa que exponencia- 
dos não terão valores negativos. Como o logaritmo de O 
(sem efeito) é 1,0, um coeficiente exponenciado igual a 
1,0 na verdade corresponde a uma relação sem direção. 
Assim, coeficientes exponenciados acima de 1,0 refletem 
uma relação positiva, e valores menores que 1,0 represen- 
tam relações negativas. 


Um exemplo de interpretação. Examinemos um exem- 
plo simples para ver o que queremos dizer em termos de 
diferenças entre as duas formas de coeficientes logísticos. 


Se B, (o coeficiente original) é positivo, sua transforma- 
ção (exponencial do coeficiente) será maior que 1, o que 
significa que a razão de desigualdade aumentará para 
qualquer variação positiva da variável independente. As- 
sim, o modelo tem uma maior probabilidade prevista de 
ocorrência. De modo semelhante, se B, é negativo, o coe- 
ficiente exponenciado é menor que um e a razão de desi- 
gualdades diminui. Um coeficiente de zero se iguala a um 
valor de 1,0 no coeficiente exponenciado, o que resulta 
em nenhuma mudança na razão de desigualdades. 


Uma discussão mais detalhada da interpretação de 
coeficientes, transformação logística e procedimentos de 
estimação pode ser encontrada em diversos textos [11]. 


Magnitude da relação 

Para determinar quanto da probabilidade mudará dada 
uma variação de uma unidade na variável independente, 
o valor numérico do coeficiente deve ser avaliado. Exa- 
tamente como na regressão múltipla, os coeficientes para 
variáveis métricas e não-métricas devem ser interpretados 
de forma diferenciada, pois cada um reflete diferentes im- 
pactos sobre a variável dependente. 


Interpretação da magnitude de variáveis independentes 
métricas. Para variáveis métricas, a questão é: quanto 
a probabilidade estimada varia por conta de uma varia- 
ção unitária na variável independente? Em regressão 
múltipla, sabíamos que o coeficiente de regressão era 
o coeficiente angular da relação linear entre a medida 
independente e a dependente. Um coeficiente de 1,35 
indicava que a variável dependente aumentava 1,35 uni- 
dades cada vez que a variável independente aumentava 
uma unidade. Em regressão logística, sabemos que te- 
mos uma relação não-linear limitada entre 0 e 1, e assim 
os coeficientes devem ser interpretados de forma dife- 
rente. Além disso, temos os dois coeficientes original e 
exponenciado para considerar. 


Coeficientes logísticos originais. Apesar de mais 
apropriados para determinarem a direção da relação, os 
coeficientes logísticos originais são menos úteis na deter- 
minação da magnitude da relação. Eles refletem a varia- 
ção no valor logit (logaritmo da razão de desigualdades), 
uma unidade de medida particularmente não compreen- 
sível na representação do quanto as probabilidades real- 
mente variam. 


Coeficientes logísticos exponenciados. Coeficien- 
tes exponenciados refletem diretamente a magnitude da 
variação no valor da razão de desigualdades. Por serem 
expoentes, eles são interpretados de maneira ligeiramen- 
te diferente. Seu impacto é multiplicativo, o que significa 
que o efeito do coeficiente não é adicionado à variável 
dependente (a razão de desigualdades), mas multiplica- 
do para cada variação unitária na variável independente. 
Como tal, um coeficiente exponenciado de 1,0 denota 
mudança nenhuma (1,0 x variável independente = mu- 
dança nenhuma). Este resultado corresponde à nossa 
discussão anterior, onde coeficientes exponenciados me- 
nores que 1,0 refletem relações negativas, enquanto va- 
lores acima de 1,0 denotam relações positivas. 


Um exemplo de avaliação da magnitude de variação. 
Talvez uma abordagem mais fácil para determinar a 
quantia de variação na probabilidade a partir desses va- 
lores seja como se segue: 


Mudança percentual na razão de desigualdades = 
(coeficiente exponenciado, — 1,0) x 100 


Os exemplos a seguir ilustram como calcular a varia- 
ção de probabilidade devido a uma variação unitária na 
variável independente para um domínio de coeficientes 
exponenciados: 


Valor 
Coeficiente expo- 020 050 10 15 17 
nenciado (e”,) 
e =10 —0,80 —0,550 00 0,50 0,70 
Variação percentu- —80% —50% 0% 50% 70% 


al na razão de desi- 
gualdades 


Se o coeficiente exponenciado é 0,20, uma mudança 
de uma unidade na variável independente reduzirá a 
razão de desigualdades em 80% (o mesmo se a razão 
de desigualdades fosse multiplicada por 0,20). Analo- 
gamente, um coeficiente exponenciado de 1,5 denota 
um aumento de 50% na razão de desigualdades. 


Um pesquisador que conhece a razão de desigualda- 
des existente e deseja calcular o novo valor dessa razão 
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para uma mudança na variável independente pode fazê-lo 
diretamente através do coeficiente exponenciado, como 
se segue: 


Novo valor de razão de desigualdade = Valor antigo 
x Coeficiente exponenciado x Variação na variável 
independente 


Usemos um exemplo simples para ilustrar a maneira 
como o coeficiente exponenciado afeta o valor da razão 
de desigualdades. 


Considere que a razão de desigualdade é 1,0 (ou seja, 
50-50) quando a variável independente tem um valor de 
5,5 e o coeficiente exponenciado é 2,35. Sabemos que se 
este coeficiente for maior do que 1,0, então a relação é 
positiva, mas gostaríamos de saber o quanto a razão de 
desigualdades mudaria. Se esperamos que o valor da va- 
riável independente aumente 1,5 pontos para 7,0, pode- 
mos calcular o seguinte: 


Nova razão de desigualdades = 1,0 x 2,35 
x(7,0-5,5) = 3,525 


Razões de desigualdades podem ser traduzidas em 
termos de valores de probabilidade pela fórmula simples 
de Probabilidade = Razão de desigualdades/(1+Razão 
de desigualdades). Logo, a razão de 3,525 se traduz em 
uma probabilidade de 77,9% (3,25/(1 + 3,25)= 0,779), in- 
dicando que um aumento na variável independente de 
um ponto e meio aumenta a probabilidade de 50% para 
78%, um aumento de 28%. 

A natureza não-linear da curva logística é demons- 
trada, porém, quando novamente aplicamos o mesmo 
aumento à razão de desigualdades. Dessa vez, considere 
que a variável independente aumenta mais 1,5 pontos, 
para 8,5. Podemos esperar que a probabilidade aumente 
outros 28%? Não, pois isso faria a probabilidade ultra- 
passar os 100% (78% + 28% = 106%). Assim, o aumen- 
to ou diminuição da probabilidade diminui à medida que 
a curva se aproxima, mas jamais alcança, os dois pontos 
extremos (0 e 1). Neste exemplo, outro aumento de 1,5 
cria um novo valor de razão de desigualdades de 12,426, 
traduzindo-se como uma razão de desigualdades de 
92,6%, um aumento de 14%. Observe que neste caso de 
aumento de probabilidade a partir de 78%, o aumento 
na mesma para a variação de 1,5 na variável indepen- 
dente é metade (14%) daquilo que foi para o mesmo au- 
mento quando a probabilidade era de 50%. 


O pesquisador pode descobrir que coeficientes expo- 
nenciados são bastante úteis não apenas na avaliação do 
impacto de uma variável independente, mas no cálculo da 
magnitude dos efeitos. 


Interpretação da magnitude para variáveis independentes 
não-métricas (dicotômicas). Como discutimos em re- 


gressão múltipla, variáveis dicotômicas representam uma 
única categoria de uma variável não-métrica (ver Capítulo 
4 para uma discussão mais detalhada sobre o tema). Como 
tais, elas não são como variáveis métricas que variam em 
um intervalo de valores, mas assumem apenas os valores 
de 1 ou 0, indicando a presença ou ausência de uma carac- 
terística. Como vimos na discussão anterior para variáveis 
métricas, os coeficientes exponenciados são a melhor ma- 
neira de interpretar o impacto da variável dicotômica, mas 
são interpretados diferentemente das variáveis métricas. 

Sempre que uma variável dicotômica é usada, é essen- 
cial notar a categoria de referência ou omitida. Em uma 
maneira semelhante à interpretação em regressão, o co- 
eficiente exponenciado representa o nível relativo da va- 
riável dependente para o grupo representado versus o 
grupo omitido. Podemos estabelecer essa relação como se 
segue: 


Razão de Coeficiente exponenciado 

. = pd a 1 do 
desigualdades ia Razão de desigualdades, ria 
de referência 


representada 


Usemos um exemplo simples de dois grupos para ilus- 
trar esses pontos. 


Se a variável não-métrica é sexo, as duas possibilidades 
são masculino e feminino. A variável dicotômica pode 
ser definida como representando homens (i.e., valor 1 se 
for homem e O se for mulher) ou mulheres (i.e., valor 
1 se for mulher e O se for homem). Qualquer que seja 
o caminho escolhido, porém, ele se determina como o 
coeficiente é interpretado. Consideremos que um valor 
1 é dado às mulheres, fazendo com que o coeficiente 
exponenciado represente o percentual da razão de de- 
sigualdades de mulheres comparada com homens. Se o 
coeficiente é 1,25, então as mulheres têm uma razão de 
desigualdades 25% maior do que os homens (1,25 — 1,0 = 
0,25). Analogamente, se o coeficiente é 0,80, então a ra- 
zão de desigualdades para mulheres é 20% menor (0,80 
— 1,0=-0,20) do que para os homens. 


Cálculo de probabilidades para um valor 
específico da variável independente 

Na discussão anterior da distribuição assumida de possí- 
veis variáveis dependentes, descrevemos uma curva em 
forma de S, ou logística. Para representar a relação entre 
as variáveis dependente e independentes, os coeficientes 
devem, na verdade, representar relações não-lineares 
entre as variáveis dependente e independentes. Apesar 
de o processo de transformação que envolve logaritmos 
fornecer uma linearização da relação, o pesquisador deve 
lembrar que os coeficientes na verdade correspondem a 
diferentes coeficientes angulares na relação ao longo dos 
valores da variável independente. Desse modo, a distri- 
buição em forma de S pode ser estimada. Se o pesquisa- 
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dor estiver interessado no coeficiente angular da relação 
em vários valores da variável independente, os coeficien- 
tes podem ser calculados e a relação, avaliada [6]. 


Visão geral da interpretação dos coeficientes 

A similaridade dos coeficientes com aqueles encontrados 
em regressão múltipla tem sido uma razão prioritária para 
a popularidade da regressão logística. Como vimos na dis- 
cussão anterior, muitos aspectos são bastante semelhan- 
tes, mas o caráter único da variável dependente (a razão 
de desigualdades) e a forma logarítmica da variável esta- 
tística (necessitando uso dos coeficientes exponenciados) 
requer uma abordagem de algum modo de interpretação 
diferente. O pesquisador, contudo, ainda tem a habilidade 
para avaliar a direção e a magnitude do impacto de cada 
variável independente sobre a medida dependente e, em 
última instância, a precisão de classificação do modelo lo- 
gístico. 


Resumo 


O pesquisador que se defronta com uma variável depen- 
dente dicotômica não precisa apelar para métodos elabo- 
rados para acomodar as limitações da regressão múltipla, 
e nem precisa ser forçado a empregar a análise discrimi- 
nante, especialmente se suas suposições estatísticas são 
violadas. A regressão logística aborda esses problemas e 
fornece um método desenvolvido para lidar diretamente 
com essa situação da maneira mais eficiente possível. 


UM EXEMPLO ILUSTRATIVO 
DE REGRESSAO LOGISTICA 


A regressão logística é uma alternativa atraente à análise 
discriminante sempre que a variável dependente tem ape- 
nas duas categorias. Suas vantagens em relação à análise 
discriminante incluem as seguintes: 


1. É menos afetada do que a análise discriminante pelas de- 
sigualdades de variância-covariância ao longo dos grupos, 
uma suposição básica da análise discriminante. 

2. Lida facilmente com variáveis independentes categóricas, 
enquanto na análise discriminante o uso de variáveis dico- 
tômicas cria problemas com igualdades de variância-cova- 
riância. 

3. Os resultados empíricos acompanham paralelamente os da 
regressão múltipla em termos de sua interpretação e das 
medidas diagnósticas de casos disponíveis para exame de 
resíduos. 


O exemplo a seguir, idêntico ao da análise discrimi- 
nante de dois grupos discutido anteriormente, ilustra essas 
vantagens e a similaridade da regressão logística com os 
resultados obtidos da regressão múltipla. Como veremos, 
ainda que a regressão logística tenha muitas vantagens 
como alternativa à análise discriminante, o pesquisador 
deve interpretar cuidadosamente os resultados devido aos 


REGRAS PRÁTICAS 5-5 


Regressão logística 


Regressão logística é o método preferido para variáveis 
dependentes de dois grupos (binárias) devido à sua 
robustez, facilidade de interpretação e diagnóstico 
Testes de significância de modelo são feitos com um 
teste de qui-quadrado sobre as diferenças no logaritmo 
da verossimilhança (-2LL) entre dois modelos 
Coeficientes são expressos em duas formas: original e 
exponenciado, para auxiliar na interpretação 

A interpretação dos coeficientes quanto a direção e 

magnitude é: 

e Direção pode ser avaliada diretamente nos 
coeficientes originais (sinais positivos ou negativos) 
ou indiretamente nos exponenciados (menor que 1 é 
negativa e maior que 1 é positiva) 

Magnitude é avaliada melhor pelo coeficiente 
exponenciado, com a variação percentual na variável 
dependente mostrada por: 
Variação percentual = (Coeficiente exponenciado — 
1,0) x 100 


aspectos ímpares de como a regressão logística lida com a 
previsão de probabilidades e de pertinência a grupos. 


Estágios 1, 2 e 3: Objetivos da 
pesquisa, planejamento de pesquisa 
e suposições estatísticas 


As questões abordadas nos primeiros três estágios do pro- 
cesso de decisão são idênticas para a análise discriminante 
de dois grupos e para a regressão logística. 


O problema de pesquisa ainda é determinar se as dife- 
renças de percepções de HBAT (X, a X,,) existem entre 
os clientes dos EUA/ América do Norte e aqueles do res- 
to do mundo (X,). A amostra de 100 clientes é dividida 
em uma amostra de análise de 60 observações, com as 
40 observações restantes constituindo a amostra de va- 
lidação. 


Agora nos concentramos sobre os resultados obtidos 
a partir do uso de regressão logística para estimar e com- 
preender as diferenças entre esses dois tipos de clientes. 


Estágio 4: Estimação do modelo de regressão 
logística e avaliação do ajuste geral 


Antes que comece o processo de estimação, é possível 
rever as variáveis individuais e avaliar seus resultados 
univariados em termos de diferenciação entre grupos. 
Sabendo-se que os objetivos da análise discriminante e da 
regressão logística são os mesmos, podemos usar as mes- 
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mas medidas de discriminação para avaliar efeitos univa- 
riados, como foi feito para a análise discriminante. 


Se revisarmos nossa discussão a respeito das diferenças 
dos grupos quanto às 13 variáveis independentes (olhar 
a Tabela 5-5), lEmbraremos que cinco variáveis (X,, X,, 
X o» X 43, € X,;) tinham diferenças estatisticamente signi- 
ficantes entre os dois grupos. Se você olhar novamente a 
discussão no exemplo de dois grupos, lembre de uma in- 
dicação de multicolinearidade entre essas variáveis, pois 
ambas X, e X,, eram parte do fator Valor do produto 
derivado pela análise fatorial (ver Capítulo 3). A regres- 
são logística é afetada por multicolinearidade entre as 
variáveis independentes de uma maneira semelhante à 
análise discriminante e análise de regressão. 


Exatamente como em análise discriminante, essas 
cinco variáveis seriam as candidatas lógicas para inclu- 
são na variável estatística de regressão logística, pois elas 
demonstram as maiores diferenças entre grupos. Regres- 
são logística pode incluir uma ou mais dessas variáveis no 
modelo, bem como outras variáveis que não apresentam 
diferenças significantes neste estágio se elas operam em 
combinação com outras variáveis para significativamente 
melhorar a previsão. 


Estimação do modelo 

A regressão logística é estimada de maneira análoga à re- 
gressão múltipla, no sentido de que um modelo base é pri- 
meiramente estimado para fornecer um padrão para com- 
paração (ver discussão anterior para maiores detalhes). 
Em regressão múltipla, a média é usada para estabelecer 


o modelo base e calcular a soma total de quadrados. Em 
regressão logística, o mesmo processo é empregado, com 
a média usada no modelo estimado não para estabelecer a 
soma de quadrados, mas para estabelecer o valor do loga- 
ritmo da verossimilhança. A partir desse modelo, podem 
ser estabelecidas as correlações parciais para cada variá- 
vel e a variável mais discriminante pode ser escolhida de 
acordo com os critérios de seleção. 


Estimação do modelo base. A Tabela 5-25 contém os 
resultados do modelo base para a análise de regressão lo- 
gística. O valor do logaritmo da verossimilhança (-2LL) 
aqui é 82,108. A estatística escore, uma medida de asso- 
ciação usada em regressão logística, é a medida usada 
para selecionar variáveis no procedimento stepwise. Di- 
versos critérios podem ser empregados para orientar a 
entrada: maior redução no valor -2LL, maior coeficiente 
de Wald, ou maior probabilidade condicional. Em nosso 
exemplo, empregamos o critério da redução da razão do 
logaritmo da verossimilhança. 

Ao revermos a estatística de escores de variáveis não 
presentes no modelo neste momento, percebemos que as 
mesmas cinco variáveis com diferenças estatisticamente 
significantes (X,, X,, X 43, X15 € X,5) também são s únicas 
variáveis com estatística de escore significante na Tabela 
5-25. Como o procedimento stepwise seleciona a variável 
com a maior estatística de escore, X,, deve ser a variável 
adicionada no primeiro passo. 


Estimação stepwise: adição da primeira variável, 
X,» Como esperado, X,, foi escolhida para entrada 
no primeiro passo do processo de estimação (ver Tabela 
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TABELA 5-25 Resultados do modelo base da regressão logística 


Ajuste geral do modelo: medidas da qualidade do ajuste 


—2 Logaritmo de verossimilhança (-2LL) 


Valor 
82,108 


Variáveis fora da equação 


Variáveis independentes 


Qualidade do produto 
Atividades de comércio eletrônico 
Suporte técnico 

Solução de reclamação 

o Anúncio 

Linha do produto 

Imagem da equipe de venda 
s Preços competitivos 

4 Garantia e reclamações 

s Novos produtos 

e Encomenda e cobrança 

+ Flexibilidade de preço 

s Velocidade de entrega 


XXX MAMA 


Estatística de escore Significância 


11,925 0,001 
2,052 0,152 
1,609 0,205 
0,866 0,352 
0,791 0,374 

18,323 0,000 
8,622 0,003 

21,330 0,000 
0,465 0,495 
0,614 0,433 
0,090 0,764 

21,204 0,000 
0,157 0,692 
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TABELA 5-26 Estimação stepwise da regressão logística: Adição de X,, (Preços competitivos) 


Ajuste geral do modelo: medidas da qualidade de ajuste 


VARIAÇÃO EM -2LL 


Do modelo base Do passo anterior 
Valor Variação  Significância Variação  Significância 
—2 Logaritmo de verossimilhança (-2LL) 56,971 25,136 0,000 25,136 0,000 
R? de Cox e Snell 0,342 
FÊ de Nagelkerke 0,459 
Pseudo Rº 0,306 
Valor Significância 
Xé de Hosmer e Lemeshow VE SEo 0,027 
Variáveis na equação 
Variável independente B Erro padrão Wald df Sig. Exp(B) 
X,3 Preços competitivos 1,129 0,287 15,471 1 0,000 3,092 
Constante —7,008 1,836 14,570 1 0,000 0,001 
B = coeficiente logístico, Exp(B) = coeficiente exponenciado 
Variáveis fora da equação 
Variáveis independentes Estatística de escore Significância 
X Qualidade do produto 4,859 0,028 
X, Atividades de comércio eletrônico 0,132 0,716 
X; Suporte técnico 0,007 0,932 
X Solução de reclamação 1,379 0,240 
Xo Anúncio 0,129 0,719 
X, Linha do produto 6,154 0,013 
X, Imagem da equipe de venda 2,745 0,098 
X Garantia e reclamações 0,640 0,424 
X,; Novos produtos 0,344 0,557 
Xe Encomenda e cobrança 2,529 0,112 
X, Flexibilidade de preço 13,723 0,000 
X,s Velocidade de entrega 1,206 0,272 
Matriz de classificação 
Pertinência prevista em grupo” 
AMOSTRA DE ANÁLISE? AMOSTRA DE TESTE? 
X, Região X, Região 
EUA/América Fora da Amé- EUA/América Fora da Amé- 

Pertinência real em grupo do Norte rica do Norte Total do Norte rica do Norte Total 

EUA/América do Norte 19 7 26 4 9 13 
(73,1) (30,8) 
Fora da América do Norte 9 25 34 1 26 27 
(73,5) (96,3) 


“73,3% de amostra de análise corretamente classificada. 
º75,0% da amostra de teste corretamente classificada. 
“Valores entre parênteses são percentuais corretamente classificados (razão de sucesso). 
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(Continuação) 

5-26). Ela corresponde à maior estatística de escore em 
todas as 13 variáveis de percepções. A entrada de X,, 
no modelo de regressão logística conseguiu um razoável 
ajuste, com valores pseudo Rº variando de 0,306 a 0,459 
e as razões de sucesso de 73,3% e 75% para as amostras 
de análise e de teste, respectivamente. 

O exame dos resultados, porém, identifica duas razões 
para se considerar um estágio extra para adicionar variá- 
veis ao modelo de regressão logística: 


e Três variáveis não presentes no modelo logístico cor- 
rente (X,,, X,, e X,) têm estatísticas de escore estatis- 
ticamente significantes, indicando que a inclusão das 
mesmas melhoraria consideravelmente o ajuste geral do 
modelo. 

e À razão de sucesso geral para a amostra de teste é boa 
(75,0%), mas um dos grupos (Clientes dos EUA/Améri- 
ca do Norte) tem uma razão de sucesso inaceitavelmen- 
te baixa de 30,8%. 


Estimação stepwise: Adição da segunda variável, X,. Es- 
pera-se que um ou mais passos no procedimento stepwise 
resulte na inclusão de todas as variáveis independentes 
com estatística de escore significante, bem como sejam 
atingidas razões aceitáveis de sucesso (geral e específicas 
de grupos) tanto para a amostra de análise quanto para a 
de teste. 


X,, com a maior estatística de escore depois de adicionar 
X,», foi escolhida para entrada no passo 2 (Tabela 5-27). 
Melhoras em todas as medidas de ajuste de modelo varia- 
ram de uma queda no valor -2LL até as várias medidas 
Rº. Mais importante sob uma perspectiva de estimação 
de modelo, nenhuma das variáveis fora da equação tinha 
variações estatisticamente significantes de escores. 


Assim, o modelo logístico de duas variáveis incluindo 
X, e X, será o modelo final a ser usado para fins de ava- 
liação de ajuste do mesmo, de precisão preditiva e de in- 
terpretação dos coeficientes. 


Avaliação do ajuste geral do modelo 

Ao se fazer uma avaliação do ajuste geral de um mode- 
lo logístico de regressão, podemos empregar três abor- 
dagens: medidas estatísticas de ajuste geral do modelo, 
medidas pseudo R”, e precisão de classificação expressada 
na razão de sucesso. Cada uma dessas abordagens será 
examinada para os modelos de regressão logística de uma 
variável e de duas variáveis que resultaram do procedi- 
mento stepwise. 


Medidas estatísticas. A primeira medida estatística é o 
teste qui-quadrado para a variação no valor -2LL do mo- 
delo base, que é comparável com o teste F geral em regres- 
são múltipla. Valores menores da medida —2LL indicam um 


melhor ajuste de modelo, e o teste estatístico está disponí- 
vel para avaliar a diferença entre o modelo base e os demais 
modelos propostos (em um procedimento stepwise, este tes- 
te está sempre baseado na melhora do passo anterior). 


e No modelo de uma só variável (ver Tabela 5-26), o va- 
lor -2LL é reduzido a partir do valor do modelo base de 
82,108 para 59,971*, uma queda de 25,136. Este aumen- 
to em ajuste de modelo foi estatisticamente significante 
no nível 0,000. 

e No modelo de duas variáveis, o valor -2LL diminuiu 
mais para 39,960, resultando em quedas significantes não 
apenas do modelo base (42,148), mas também uma queda 
significante do modelo de uma variável (17,011). Ambas 
as melhoras de ajuste foram significantes no nível 0,000. 


A segunda medida estatística é a de Hosmer e Le- 
meshow de ajuste geral [11]. Este teste estatístico mede a 
correspondência dos valores reais e previstos da variável 
dependente. Neste caso, um ajuste melhor de modelo é 
indicado por uma diferença menor na classificação obser- 
vada e prevista. 


O teste de Hosmer e Lemeshow mostra significância 
para o modelo logístico de uma variável (0,027 da Ta- 
bela 5-26), indicando que diferenças significantes ainda 
permanecem entre valores reais e esperados. O modelo 
de duas variáveis, contudo, reduz o nível de significância 
para 0,722 (ver Tabela 5-27), um valor não-significante 
que aponta para um ajuste aceitável. 


Para o modelo logístico de duas variáveis, ambas as 
medidas estatísticas de ajuste geral do modelo indicam 
que o mesmo é aceitável e em um nível estatisticamente 
significante. No entanto, é necessário examinar as outras 
medidas de ajuste geral do modelo para avaliar se os re- 
sultados alcançam os níveis necessários de significância 
prática também. 


Medidas de pseudo R”. Três medidas disponíveis são 
comparáveis com a medida Rº em regressão múltipla: Rº 
de Cox e Snell, Rº de Nagelkerke, e a medida pseudo Rº 
baseada na redução no valor -2LL. 


Para o modelo de regressão logística de uma variável, 
esses valores eram (0,342, 0,459 e 0,306, respectivamen- 
te. Combinados, eles indicam que o modelo de regressão 
de uma variável explica aproximadamente um terço da 
variação na medida dependente. Apesar de o modelo de 
uma variável ser considerado estatisticamente significan- 
te em diversas medidas de ajuste geral, esses valores de 
Rº são um pouco baixos para fins de significância prática. 


(Continua) 


*N. de R. T.: O número correto é 56,971. 
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TABELA 5-27 Estimação stepwise da regressão logística: adição de X,; (Flexibilidade de preços) 


Ajuste geral do modelo: medidas da qualidade de ajuste 


VARIAÇÃO EM -2LL 


Do modelo base Do passo anterior 
Valor Variação  Significância Variação Significância 
—2 Logaritmo de verossimilhança (-2LL) 39,960 42,148 0,000 17,011 0,000 
FÊ de Cox e Snell 0,505 
Fº de Nagelkerke 0,677 
Pseudo Rº 0,513 
Valor Significância 
x? de Hosmer e Lemeshow 5,326 0,722 
Variáveis na equação 
Variável independente B Erro padrão Wald df Sig. Exp(B) 
X,3 Preços competitivos 1,079 0,357 9,115 1 0,003 2,942 
X, Flexibilidade de preços 1,844 0,639 8,391 1 0,004 6,321 
Constante —14,192 3,712 14,614 1 0,000 0,000 
B = coeficiente logístico, Exp(B) = coeficiente exponenciado 
Variáveis fora da equação 
Variáveis independentes Estatística de escore Significância 
X Qualidade do produto 0,656 0,418 
X, Atividades de comércio eletrônico 3,501 0,061 
X; Suporte técnico 0,006 0,937 
X Solução de reclamação 0,693 0,405 
Xo Anúncio 0,091 0,762 
X, Linha do produto 3,409 0,065 
X,» Imagem da equipe de venda 0,849 0,357 
X Garantia e reclamações 2,327 0,127 
X, Novos produtos 0,026 0,873 
Xe Encomenda e cobrança 0,010 0,919 
Xe Velocidade de entrega 2,907 0,088 
Matriz de classificação 
Pertinência prevista em grupo” 
AMOSTRA DE ANÁLISE? AMOSTRA DE TESTE? 
X, Região X, Região 
EUA/América Fora da Amé- EUA/América Fora da Amé- 

Pertinência real em grupo do Norte rica do Norte Total do Norte rica do Norte Total 

EUA/América do Norte 25 1 26 9 4 13 
(96,2) (69,2) 
Fora da América do Norte 6 28 34 2 25 27 
(82,4) (92,6) 


*88,3% de amostra de análise corretamente classificada. 
º85,0% da amostra de teste corretamente classificada. 
“Valores entre parênteses são percentuais corretamente classificados (razão de sucesso). 
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(Continuação) 
O modelo de duas variáveis (ver Tabela 5-27) tem 


valores R” que são ambos maiores que 0,50, apontando 
para um modelo de regressão logística que explica pelo 
menos metade da variação entre os dois grupos de clien- 
tes. Sempre se deseja melhorar tais valores, mas tal nível 
é considerado praticamente significante nesta situação. 


Os valores Rº do modelo de duas variáveis exibiram 
considerável melhora sobre o modelo de uma variável e 
indicam bom ajuste quando comparados aos valores Rº 
geralmente encontrados em regressão múltipla. De acor- 
do com as medidas de ajuste de caráter estatístico, o mo- 
delo é considerado aceitável em termos de significância 
estatística e prática. 


Precisão de classificação. O terceiro exame de ajuste ge- 
ral do modelo será para avaliar a precisão de classificação 
do modelo em uma medida final de significância prática. 
As matrizes de classificação, idênticas em natureza âque- 
las empregadas em análise discriminante, representam os 
níveis de precisão preditiva atingidos pelo modelo logís- 
tico. A medida de precisão preditiva usada é a razão de 
sucesso, o percentual de casos corretamente classificados. 
Esses valores serão calculados tanto para a amostra de 
análise quanto a de teste, e medidas específicas de grupos 
serão examinadas além das medidas gerais. Além disso, 
comparações podem ser feitas, como ocorreu em análise 
discriminante, com padrões de comparação representan- 
do os níveis de precisão preditiva conseguidos por chan- 
ces (ver discussão mais detalhada na seção sobre análise 
discriminante). 


Os padrões de comparação para as razões de sucesso 
da matriz de classificação serão os mesmos que foram 
calculados para a análise discriminante de dois grupos. 
Os valores são 65,5% para o critério de chance propor- 
cional (a medida preferida) e 76,3% para o critério de 
chance máxima. Se você não estiver familiarizado com 
os métodos de cálculo de tais medidas, veja a discussão 
anterior no capítulo que trata de avaliação da precisão 
de classificação. 

e Asrazões de sucesso geral para o modelo logístico de 
uma variável são 73,3% e 75,0% para as amostras de 
análise e de teste, respectivamente. Mesmo que as ra- 
zões de sucesso geral sejam maiores do que o critério 
de chance proporcional e comparáveis com o critério 
de chance máxima, um problema considerável surge 
na amostra de teste para os clientes dos EUA/América 
do Norte, onde a razão de sucesso é de somente 30,8%. 
Este nível está abaixo de ambos os padrões e demanda 
que o modelo logístico seja expandido até o ponto em 
que, espera-se, esta razão de sucesso específica de grupo 
exceda os padrões. 

e O modelo de duas variáveis exibe melhora substancial 
na razão de sucesso geral e nos valores específicos de 


grupos. As razões de sucesso geral subiram para 88,3% 
e 85,0% para as amostras de análise e de teste, respec- 
tivamente. Além disso, a problemática razão de suces- 
so na amostra de teste aumenta para 69,2%, acima do 
valor padrão para o critério de chance proporcional. 
Com essas melhoras nos níveis geral e específicos, 

o modelo de regressão logística de duas variáveis é 
considerado aceitável em termos de precisão de classi- 
ficação. 


Em todos os três dos tipos básicos de medida de 
ajuste geral, o modelo de duas variáveis (com X,,e X,,) 
demonstra níveis aceitáveis de significância estatística e 
prática. Com ajuste de modelo geral aceitável, voltamos 
nossa atenção para a avaliação dos testes estatísticos dos 
coeficientes logísticos a fim de identificar os coeficien- 
tes que têm relações significantes afetando pertinência 
a grupo. 


Significância estatística dos coeficientes 

Os coeficientes estimados para as duas variáveis indepen- 
dentes e a constante também podem ser avaliados quanto 
à significância estatística. A estatística Wald é usada para 
avaliar significância de um modo semelhante ao teste t uti- 
lizado em regressão múltipla. 


Os coeficientes logísticos para X,; (1,079) e X,, (1,844) e a 
constante (-14,190*) são todos significantes no nível 0,01 
com base no teste estatístico de Wald. Nenhuma outra 
variável consegue entrar no modelo e atingir pelo menos 
um nível de significância de 0,05. 


Assim, as variáveis individuais são significantes e po- 
dem ser interpretadas para identificar as relações que 
afetam as probabilidades previstas e subsequentemente a 
pertinência a grupo. 


Diagnósticos por casos 

A análise da má classificação de observações individuais 
pode fornecer uma melhor visão sobre possíveis melhora- 
mentos do modelo. Diagnósticos por casos, como resídu- 
os e medidas de influências, estão disponíveis, bem como 
a análise de perfil discutida anteriormente para a análise 
discriminante. 


Neste caso, apenas 13 casos foram mal classificados (7 
na amostra de análise e 6 na de teste). Dado o elevado 
grau de correspondência entre esses casos e aqueles mal 
classificados estudados na análise discriminante de dois 
grupos, o processo de estabelecimento de perfil não será 
novamente levado adiante (leitores interessados podem 
rever o exemplo de dois grupos). Diagnóstico por casos, 


*N. de R.T.: O número correto é -14,192. 
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como resíduos e medidas de influência estão disponí- 
veis. Dados os baixos níveis de má classificação, porém, 
nenhuma análise complementar de classificação ruim é 
executada. 


Estágio 5: Interpretação dos resultados 


O procedimento de regressão logística stepwise produziu 
uma variável estatística muito semelhante àquela da aná- 
lise discriminante de dois grupos, apesar de ter uma variá- 
vel independente a menos. Examinaremos os coeficientes 
logísticos para avaliarmos a direção e o impacto que cada 
variável tem sobre a probabilidade prevista e a pertinên- 
cia a grupo. 


Interpretação dos coeficientes logísticos 


O modelo final de regressão logística inclui duas variá- 
veis (X,, e X,,) com coeficientes de regressão de 1,079 
e 1,844, respectivamente, e uma constante de —14,190* 
(ver Tabela 5-27). A comparação desses resultados com 
a análise discriminante de dois grupos revela resultados 
quase idênticos, uma vez que a análise discriminante in- 
cluiu três variáveis no modelo de dois grupos — X,, e X,, 
juntamente com X,,. 


Direção das relações. Para avaliar a direção da relação 
de cada variável, podemos examinar ou os coeficientes 
logísticos originais, ou os coeficientes exponenciados. Co- 
mecemos com os originais. 


Se você recordar de nossa discussão anterior, podemos 
interpretar a direção da relação diretamente a partir do 
sinal dos coeficientes logísticos originais. Neste caso, am- 
bas as variáveis têm sinais positivos, o que aponta para 
uma relação positiva entre ambas as variáveis indepen- 
dentes e a probabilidade prevista. À medida que os va- 
lores de X,, ou X,, aumentam, a probabilidade prevista 
aumenta, fazendo crescer assim a possibilidade de que 
um cliente seja categorizado como residindo fora da 
América do Norte. 

Voltando nossa atenção para os coeficientes expoen- 
ciados, devemos recordar que valores acima de 1,0 indi- 
cam uma relação positiva e valores abaixo de 1,0 apontam 
para uma relação negativa. Em nosso caso, os valores de 
2,942 e 6,319 também refletem relações positivas. 


Magnitude das relações. O método mais direto para 
avaliar a magnitude da variação na probabilidade devido 
a cada variável independente é examinar os coeficientes 
exponenciados. Como você deve lembrar, o coeficiente 
exponenciado menos um é igual à variação percentual da 
razão de desigualdades. 


Em nosso caso, isso significa que um aumento de um 
ponto aumenta a razão de desigualdades em 194% para 
X, e 531% para X,,. Esses números podem exceder 
100% de variação porque eles estão aumentando a razão 
de desigualdades e não as probabilidades propriamente 
ditas. Os impactos são grandes porque o termo constan- 
te (-14,190%) define um ponto inicial de quase zero para 
os valores de probabilidade. Logo, grandes aumentos na 
razão de desigualdades são necessários para se conseguir 
valores maiores de probabilidades. 


Outra abordagem na compreensão sobre como os coefi- 
cientes logísticos definem probabilidade é calcular a proba- 
bilidade prevista para qualquer conjunto de valores para as 
variáveis independentes. 


Para as variáveis independentes X,, e X,,, usemos as 
médias para os dois grupos. Dessa maneira podemos ver 
qual seria a probabilidade prevista para um membro mé- 
dio de cada grupo. 

A Tabela 5-28 mostra os cálculos para a previsão da 
probabilidade para os dois centróides de grupo. Como 
podemos perceber, o centróide para o grupo O (clientes 
na América do Norte) tem uma probabilidade prevista 
de 18,9%, enquanto o centróide para o grupo 1 (fora da 
América do Norte) tem uma probabilidade prevista de 
94,8%. Este exemplo demonstra que o modelo logístico 
cria de fato uma separação entre os dois centróides de 
grupo em termos de probabilidade prevista, gerando ex- 
celentes resultados de classificação conquistados para as 
amostras de análise e de teste. 


Os coeficientes logísticos definem relações positivas 
para ambas as variáveis independentes e fornecem uma 
maneira de avaliar o impacto de uma variação em uma ou 
ambas as variáveis sobre a razão de desigualdades e conse- 
quentemente sobre a probabilidade prevista. Fica evidente 
por que muitos pesquisadores preferem regressão logística 
à análise discriminante quando comparações são feitas so- 
bre a informação mais útil disponível nos coeficientes logís- 
ticos em contrapartida com as cargas discriminantes. 


Estágio 6: Validação dos resultados 


A validação do modelo de regressão logística é consegui- 
da neste exemplo através do mesmo método usado em 
análise discriminante: criação de amostras de análises e 
de teste. Examinando a razão de sucesso para a amostra 
de teste, o pesquisador pode avaliar a validade externa e a 
significância prática do modelo de regressão logística. 


Para o modelo final de regressão logística de duas va- 


riáveis, as razões de sucesso para as amostras de análi- 
(Continua) 


*N. de R.T.: O número correto é -14,192. 
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TABELA 5-28 Cálculo de valores de probabilidade estimada para os centróides 
de grupos da região X, 


X, (Região) 
Grupo O: EUA/América Grupo 1: Fora da 
do Norte América do Norte 
Centróide: X,, 5,60 7,42 
Centróide: X,, 3,63 4,93 
Valor logit” —1,452 2,909 
Razão de desigualdades” 0,234 18,332 
Probabilidade” 0,189 0,948 


*Calculado como: Logit = — 14,190 + 1,079X,, + 1,844X,, 
ºCalculada como: Razão de desigualdades = e!ºº! 


“Calculada como: Probabilidade = Razão de desigualdades/(1+Razão de desigualdades) 


(Continuação) 
se e de teste excedem todos os padrões de comparação 


(critérios de chance proporcional e de chance máxima). 
Além disso, todas as razões de sucesso específicas de 
grupos são suficientemente grandes para a aceitação. 
Esse aspecto é especialmente importante para a amos- 
tra de teste, que é o principal indicador de validade ex- 
terna. 


Esses resultados levam à conclusão de que o modelo 
de regressão logística, como também descoberto com o 
modelo de análise discriminante, demonstrou validade 
externa suficiente para a completa aceitação dos resul- 
tados. 


Uma visão gerencial 


A regressão logística apresenta uma alternativa à analise 
discriminante que pode ser mais confortável para muitos 
pesquisadores devido à sua similaridade com regressão 
múltipla. Dada a sua robustez diante das condições de 
dados que podem afetar negativamente a análise discri- 
minante (p.ex., matrizes diferentes de variância-covariân- 
cia), a regressão logística é também a técnica preferida de 
estimação em muitas aplicações. 


Quando comparada com análise discriminante, a re- 
gressão logística fornece precisão preditiva compa- 
rável com uma variável estatística mais simples que 
usava a mesma interpretação substancial, apenas 
com uma variável a menos. A partir dos resultados 
da regressão logística, o pesquisador pode se concen- 
trar na competitividade e na flexibilidade de preços 
como as principais variáveis de diferenciação entre 
os dois grupos de clientes. A meta nesta análise não 
é aumentar probabilidade (como poderia ser o caso 
de se analisar sucesso versus fracasso), ainda que a 
regressão logística forneça uma técnica direta para a 
HBAT compreender o impacto relativo de cada va- 
riável independente na criação de diferenças entre os 
dois grupos de clientes. 


Resumo 


A natureza intrínseca, os conceitos e a abordagem para a 
análise discriminante múltipla e a regressão logística fo- 
ram apresentadas. Orientações básicas para sua aplicação 
e interpretação foram incluídas para melhor esclarecer os 
conceitos metodológicos. Este capítulo ajuda você a fazer 
o seguinte: 


Estabelecer as circunstâncias sob as quais a análise discri- 
minante linear ou a regressão logística devem ser usadas 
ao invés da regressão múltipla. Ao se escolher uma téc- 
nica analítica apropriada, às vezes encontramos um pro- 
blema que envolve uma variável dependente categórica 
e diversas variáveis independentes métricas. Lembre-se 
que a variável dependente em regressão foi medida me- 
tricamente. Análise discriminante múltipla e regressão 
logística são as técnicas estatísticas apropriadas quando o 
problema de pesquisa envolve uma única variável depen- 
dente categórica e diversas variáveis independentes mé- 
tricas. Em muitos casos, a variável dependente consiste de 
dois grupos ou classificações, por exemplo, masculino ver- 
sus feminino, alto versus baixo, ou bom versus ruim. Em 
outros casos, mais de dois grupos estão envolvidos, como 
classificações baixas, médias e altas. A análise discrimi- 
nante e a regressão logística são capazes de lidar com dois 
ou múltiplos (três ou mais) grupos. Os resultados de uma 
análise discriminante e de uma regressão logística podem 
auxiliar no perfil das características entre-grupos dos indi- 
víduos e na correspondência dos mesmos com seus grupos 
adequados. 


Identificar os principais problemas relacionados aos tipos 
de variáveis usados e os tamanhos de amostras exigidos na 
aplicação de análise discriminante. Para aplicar análise 
discriminante, o pesquisador deve primeiramente especi- 
ficar quais variáveis devem ser medidas independentes e 
qual é a dependente. O pesquisador deve se concentrar 
primeiro na variável dependente. O número de grupos da 
variável dependente (categorias) pode ser dois ou mais, 
mas tais grupos devem ser mutuamente excludentes e 
exaustivos. Depois que uma decisão foi tomada sobre a 
variável dependente, o pesquisador deve decidir quais 
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variáveis independentes devem ser incluídas na análise. 
Variáveis independentes são escolhidas de duas manei- 
ras: (1) identificando variáveis de pesquisa anterior ou do 
modelo teórico inerente à questão de pesquisa, e (2) uti- 
lizando o conhecimento e a intuição do pesquisador para 
selecionar variáveis para as quais nenhuma pesquisa ou 
teoria anterior existem mas que logicamente podem estar 
relacionadas com a previsão de grupos da variável depen- 
dente. 

A análise discriminante, como as demais técnicas mul- 
tivariadas, é afetada pelo tamanho da amostra sob análi- 
se. Uma proporção de 20 observações para cada variável 
preditora é recomendada. Como os resultados se tornam 
instáveis à medida que o tamanho da amostra diminui 
relativamente ao número de variáveis independentes, o 
tamanho mínimo recomendado é de cinco observações 
por variável independente. O tamanho amostral de cada 
grupo também deve ser considerado. No mínimo, o ta- 
manho do menor grupo de uma categoria deve exceder 
o número de variáveis independentes. Como orientação 
prática, cada categoria deve ter pelo menos 20 observa- 
ções. Mesmo que todas as categorias ultrapassem 20 ob- 
servações, porém, o pesquisador também deve considerar 
os tamanhos relativos dos grupos. Variações grandes nos 
tamanhos dos grupos afetam a estimação da função discri- 
minante e a classificação de observações. 


Compreender as suposições subjacentes à análise discri- 
minante na avaliação de sua adequação a um problema 
em particular. As suposições da análise discriminante se 
relacionam aos processos estatísticos envolvidos nos pro- 
cedimentos de estimação e classificação, bem como aos 
problemas que afetam a interpretação dos resultados. As 
suposições-chave para se obter a função discriminante são 
normalidade multivariada das variáveis independentes, e 
estruturas (matrizes) desconhecidas (mas iguais) de dis- 
persão e covariância para os grupos como definidos pela 
variável dependente. Se as suposições são violadas, o pes- 
quisador deve entender o impacto sobre os resultados que 
podem ser esperados e considerar métodos alternativos 
para análise (p.ex., regressão logística). 


Descrever as duas abordagens computacionais para análi- 
se discriminante e o método para avaliação de ajuste geral 
do modelo. As duas técnicas para análise discriminante 
são os métodos simultâneo (direto) e stepwise. A estima- 
ção simultânea envolve a computação da função discrimi- 
nante considerando todas as variáveis independentes ao 
mesmo tempo. Portanto, a função discriminante é com- 
putada com base no conjunto inteiro de variáveis inde- 
pendentes, independentemente do poder discriminante 
de cada variável independente. A estimação stepwise é 
uma alternativa ao método simultâneo. Ela envolve a en- 
trada de variáveis independentes uma por vez com base 
no poder discriminante das mesmas. O método stepwise 
segue um processo sequencial de adição ou eliminação de 


variáveis da função discriminante. Depois que esta é esti- 
mada, o pesquisador deve avaliar a significância ou ajuste 
da mesma. Quando um método simultâneo é empregado, 
o lambda de Wilks, o traço de Hotelling e o critério de 
Pillai calculam a significância estatística do poder discri- 
minatório da função estimada. Se um método stepwise é 
usado para estimar a função discriminante, o D de Maha- 
lanobis e a medida V de Rao são os mais adequados para 
avaliar ajuste. 


Explicar o que é uma matriz de classificação e como de- 
senvolver uma, e descrever as maneiras de se avaliar a 
precisão preditiva da função discriminante. Os testes 
estatísticos para avaliar a significância das funções discri- 
minantes avaliam apenas o grau de diferença entre grupos 
com base nos escores Z discriminantes, mas não indicam 
o quão bem as funções prevêem. Para determinar a habi- 
lidade preditiva de uma função discriminante, o pesqui- 
sador deve construir matrizes de classificação. O procedi- 
mento da matriz de classificação fornece uma perspectiva 
sobre significância prática no lugar de significância esta- 
tística. Antes que uma matriz de classificação possa ser 
construída, no entanto, o pesquisador deve determinar o 
escore de corte para cada função discriminante. O escore 
de corte representa o ponto de divisão utilizado para clas- 
sificar observações em cada um dos grupos, baseado no 
escore da função discriminante. O cálculo de um escore 
de corte entre dois grupos quaisquer é sustentado pelos 
dois centróides de grupo (média dos escores discriminan- 
tes) e pelos tamanhos relativos dos dois grupos. Os resul- 
tados do procedimento de classificação são apresentados 
em forma matricial. As entradas na diagonal da matriz 
representam o número de indivíduos corretamente clas- 
sificados. Os números fora da diagonal correspondem a 
classificações incorretas. O percentual corretamente clas- 
sificado, também conhecido como razão de sucesso, revela 
o quão bem a função discriminante prevê os objetos. Se os 
custos da má classificação forem aproximadamente iguais 
para todos os grupos, o escore de corte ótimo será aquele 
que classificar mal o menor número de objetos ao longo 
de todos os grupos. Se os custos de má classificação forem 
desiguais, o escore de corte ótimo será aquele que mini- 
miza os custos de má classificação. Para avaliar a razão de 
sucesso, devemos olhar para uma classificação por chan- 
ces. Quando os tamanhos de grupos são iguais, a determi- 
nação da classificação por chances se baseia no número de 
grupos. Quando os tamanhos dos grupos são distintos, o 
cálculo da classificação por chances pode ser feito de duas 
maneiras: chance máxima e chance proporcional. 


Dizer como identificar variáveis independentes com po- 
der discriminatório. Se a função discriminante é estatis- 
ticamente significante e a precisão de classificação (razão 
de sucesso) é aceitável, o pesquisador deve se concentrar 
na realização de interpretações substanciais das descober- 
tas. Este processo envolve a determinação da importância 
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relativa de cada variável independente na discriminação 
entre os grupos. Três métodos de determinação da impor- 
tância relativa foram propostos: (1) pesos discriminan- 
tes padronizados, (2) cargas discriminantes (correlações 
estruturais) e (3) valores F parciais. A abordagem tradi- 
cional para interpretar funções discriminantes examina 
o sinal e a magnitude do peso discriminante padronizado 
designado para cada variável na computação das funções 
discriminantes. Variáveis independentes com pesos re- 
lativamente maiores contribuem mais para o poder dis- 
criminatório da função do que variáveis com pesos me- 
nores. O sinal denota se a variável contribui negativa ou 
positivamente. Cargas discriminantes são cada vez mais 
usadas como uma base para interpretação por conta das 
deficiências na utilização de pesos. Medindo a correla- 
ção linear simples entre cada variável independente e a 
função discriminante, as cargas discriminantes refletem a 
variância que as variáveis independentes compartilham 
com a função discriminante. Elas podem ser interpretadas 
como cargas fatoriais na avaliação da contribuição relati- 
va de cada variável independente à função discriminante. 
Quando um método de estimação stepwise é usado, uma 
maneira adicional de interpretar o poder discriminatório 
relativo das variáveis independentes é através do empre- 
go de valores F parciais, o que se consegue examinando-se 
os tamanhos absolutos dos valores F significantes e orde- 
nando-os. Valores F grandes indicam um poder discrimi- 
natório maior. 


Justificar o uso de um método de divisão de amostra para 
validação. O estágio final de uma análise discriminante 
envolve a validação dos resultados discriminantes para 
fornecer garantias de que os mesmos têm tanto validade 
interna quanto externa. Além de validar as razões de su- 
cesso, o pesquisador deve usar o perfil dos grupos para 
garantir que as médias deles são indicadores válidos do 
modelo conceitual utilizado na seleção das variáveis in- 
dependentes. Validação pode ocorrer com uma amostra 
separada (de teste) ou utilizando um procedimento que 
repetidamente processa a amostra de estimação. Valida- 
ção das razões de sucesso é executada muito frequente- 
mente criando-se uma amostra de teste, também chama- 
da de amostra de validação. O propósito da utilização de 
uma amostra de teste para fins de validação é perceber o 
quão bem a função discriminante funciona em uma amos- 
tra de observações que não foram usadas para obtê-la. Tal 
avaliação envolve o desenvolvimento de uma função dis- 
criminante com a amostra de análise e então a aplicação 
da função à amostra de teste. 


Entender as vantagens e desvantagens da regressão lo- 
gística comparada com análise discriminante e regressão 
múltipla. Análise discriminante é apropriada quando a 
variável dependente é não-métrica. Se ela tiver apenas 
dois grupos, então a regressão logística pode ser prefe- 
rível por duas razões. Primeiro, a análise discriminante 


apóia-se no atendimento estrito das suposições de nor- 
malidade multivariada e igualdade entre as matrizes de 
variância-covariância nos grupos — premissas que não são 
atendidas em muitas situações. A regressão logística não 
se depara com tais restrições e é muito mais robusta quan- 
do essas suposições não são atendidas, tornando sua apli- 
cação adequada em muitos casos. Segundo, mesmo que 
as suposições sejam atendidas, muitos pesquisadores pre- 
ferem a regressão logística por ser semelhante à regres- 
são múltipla. Como tal, ela tem testes estatísticos diretos, 
métodos semelhantes para incorporar variáveis métricas e 
não-métricas e efeitos não-lineares, bem como uma vasta 
gama de diagnósticos. A regressão logística é equivalen- 
te à análise discriminante de dois grupos e pode ser mais 
adequada em muitas situações. 


Interpretar os resultados de uma análise de regressão lo- 
gística, com comparações com regressão múltipla e análise 
discriminante. A adequação de ajuste para um modelo 
de regressão logística pode ser avaliada de duas maneiras: 
(1) usando valores pseudo R”, semelhantes àqueles en- 
contrados em regressão múltipla, e (2) examinando pre- 
cisão preditiva (i.e., a matriz de classificação em análise 
discriminante). As duas abordagens examinam ajuste de 
modelo sob diferentes perspectivas, mas devem conduzir 
a resultados semelhantes. Uma das vantagens da regres- 
são logística é que precisamos saber apenas se um evento 
ocorreu para definir um valor dicotômico como nossa va- 
riável dependente. Quando analisamos esses dados usan- 
do transformação logística, contudo, a regressão logísti- 
ca e seus coeficientes assumem um significado um tanto 
diferente daqueles encontrados em regressão com uma 
variável dependente métrica. Analogamente, cargas em 
análise discriminante são interpretadas diferentemente 
de um coeficiente logístico. Este último reflete a direção 
e a magnitude da relação da variável independente, mas 
requer diferentes métodos de interpretação. A direção 
da relação (positiva ou negativa) retrata as variações na 
variável dependente associadas com mudanças na inde- 
pendente. Uma relação positiva significa que um aumento 
na variável independente é associado com um aumento 
na probabilidade prevista, e vice-versa para uma relação 
negativa.Para determinar a magnitude do coeficiente, ou 
o quanto que a probabilidade mudará dada uma unidade 
de variação na variável independente, o valor numérico 
do coeficiente deve ser avaliado. Exatamente como em 
regressão múltipla, os coeficientes para variáveis métricas 
e não-métricas devem ser interpretados diferentemente 
porque cada um reflete diferentes impactos sobre a variá- 
vel dependente. 

A análise discriminante múltipla e a regressão logís- 
tica ajudam a compreender e explicar problemas de pes- 
quisa que envolvem uma variável dependente categórica 
e diversas variáveis independentes métricas. Ambas as 
técnicas podem ser usadas para estabelecer o perfil das 
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características entre grupos dos indivíduos e designar os 
mesmos a seus grupos apropriados. Aplicações potenciais 
dessas duas técnicas tanto em negócios como em outras 
áreas são inúmeras. 


Questões 


1. 


en 


10. 


11. 


Como você diferenciaria entre análise discriminante múl- 
tipla, análise de regressão, regressão logística e análise de 
variância? 

Quando você empregaria regressão logística no lugar de 
análise discriminante? Quais são as vantagens e desvanta- 
gens dessa decisão? 


. Quais critérios você poderia usar para decidir se deve parar 


uma análise discriminante depois de estimar a função discri- 
minante? Depois do estágio de interpretação? 

Qual procedimento você seguiria para dividir sua amostra 
em grupos de análise e de teste? Como você mudaria este 
procedimento se sua amostra consistisse de menos do que 
100 indivíduos ou objetos? 

Como você determinaria o escore de corte ótimo? 

Como você determinaria se a precisão de classificação da 
função discriminante é suficientemente alta relativamente a 
uma classificação ao acaso? 

Como uma análise discriminante de dois grupos difere de 
uma análise de três grupos? 

Por que um pesquisador deve expandir as cargas e dados 
do centróide ao representar graficamente uma solução de 
análise discriminante? 

Como a regressão logística e a análise discriminante lidam 
com a relação das variáveis dependente e independentes? 
Quais são as diferenças de estimação e interpretação entre 
regressão logística e análise discriminante? 

Explique o conceito de razão de desigualdades e por que ela 
é usada para prever probabilidade em um procedimento de 
regressão logística. 


Leituras sugeridas 

Uma lista de leituras sugeridas ilustrando questões e apli- 
cações da análise discriminante e regressão logística está 
disponível na Web em www.prenhall.com/hair (em inglês). 
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CAPÍTULO 


Análise Multivariada de Variância 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


= Explicar a diferença entre a hipótese nula univariada de ANOVA e a hipótese nula 
multivariada de MANOVA. 

m Discutir as vantagens de uma abordagem multivariada para teste de significância comparada 
com as das abordagens univariadas mais tradicionais. 

Formular as suposições para o uso de MANOVA. 

m Discutir os diferentes tipos de estatísticas de teste que estão disponíveis para teste de 
significância em MANOVA. 

m Descrever o propósito de testes post hoc em ANOVA e MANOVA. 

nterpretar resultados de interação quando mais de uma variável independente é empregada 
em MANOVA. 

m Descrever o propósito da análise multivariada de covariância (MANCOVA). 


Apresentação do capítulo 
A análise multivariada de variância (MANOVA) é uma extensão da análise de variância (ANOVA) para 
acomodar mais de uma variável dependente. E uma técnica de dependência que mede as diferenças 


para duas ou mais variáveis dependentes métricas, com base em um conjunto de variáveis categóricas 
(não-métricas) que atuam como variáveis independentes. ANOVA e MANOVA podem ser enunciadas 


nas seguintes formas gerais: 
Análise de Variância 
tá, =XM+MS+M+...+X, 
(métrica) (não-métrica) 
Análise Multivariada de Variância 
VALLEN. + YN=M+AMA MA. + X, 
(métrica) (não-métrica) 


Assim como ANOVA, MANOVA está interessada em diferenças entre grupos (ou tratamentos expe- 
rimentais). ANOVA é chamada de procedimento univariado pelo fato de usarmos a mesma para avaliar 
diferenças de grupos em uma única variável dependente métrica. MANOVA é chamada de procedimen- 
to multivariado porque usamos a mesma para avaliar diferenças de grupos em múltiplas variáveis de- 
pendentes métricas simultaneamente. Em MANOVA, cada grupo de tratamento é observado em duas 
ou mais variáveis dependentes. 

O conceito de análise multivariada de variância foi introduzido há mais de 70 anos por Wilks [26]. 
No entanto, não foi antes do desenvolvimento de estatísticas de teste apropriadas com distribuições 
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tabeladas e da ampla disponibilidade de programas de computador para processar essas estatísticas 
que MANOVA se tornou uma ferramenta prática para pesquisadores. 

Tanto ANOVA quanto MANOVA são particularmente úteis quando usadas em conjunto com planeja- 
mentos experimentais, ou seja, delineamentos de pesquisa nos quais o pesquisador controla ou mani- 
pula diretamente uma ou mais variáveis independentes para determinar o efeito sobre a(s) variável(eis) 
dependente(s). ANOVA e MANOVA fornecem as ferramentas necessárias para julgar os efeitos obser- 
vados (ou seja, se uma diferença observada ocorre devido a um efeito de tratamento ou à variabilidade 
de amostragem aleatória). No entanto, MANOVA tem também um papel em planejamentos não-experi- 
mentais (p.ex., em levantamentos de informações) onde grupos de interesse (p.ex., sexo, comprador/ 
não-comprador) são definidos e então as diferenças em qualquer número de variáveis métricas (p.ex., 
atitudes, satisfação, taxa de compras) são avaliadas quanto à significância estatística. 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para de- 
senvolver uma compreensão dos conceitos e da terminologia 
empregados. Ao longo do capítulo, os termos-chave apare- 
cem em negrito. Outros pontos que merecem destaque no 
capítulo e referências cruzadas estão em itálico. Exemplos 
ilustrativos estão em quadros. 


Alfa («) Nível de significância associado ao teste estatístico das 
diferenças entre dois ou mais grupos. Normalmente, valores 
pequenos, como 0,05 ou 0,01, são especificados para minimi- 
zar a possibilidade de se cometer um erro Tipo |. 


| 


Análise stepdown Teste para o poder discriminatório incre- 
mental de uma variável dependente depois que os efeitos de 
outras variáveis dependentes foram levados em conta. Seme- 
lhante à regressão ou análise discriminante stepwise, esse 
procedimento, que se baseia em uma ordem especificada de 
entrada, determina o quanto uma variável dependente adicio- 
nal acrescenta à explicação das diferenças entre os grupos 
na análise MANOVA. 

Beta (B) Ver erro Tipo Il. 

Comparação planejada Teste a priori para uma comparação 
específica de diferenças de médias de grupos. Esses testes 
são executados em conjunto com os testes para efeitos prin- 
cipal e de interação usando-se um contraste. 

Contraste Procedimento para investigar diferenças específicas 
de grupos de interesse em conjunção com ANOVA e MANO- 
VA (p.ex., comparar diferenças de médias de grupos para um 
par específico de grupos). 

Covariáveis, ou análise de covariáveis Uso de procedimentos 
do tipo regressão para remover variação estranha (inconve- 
niente) nas variáveis dependentes devido a uma ou mais va- 
riáveis independentes métricas (covariáveis) não controladas. 
As covariáveis são consideradas linearmente relacionadas 
com as variáveis dependentes. Depois de se ajustar a influên- 
cia de covariáveis, uma ANOVA ou MANOVA padrão é rea- 
lizada. Esse processo de ajuste (conhecido como ANCOVA 


ou MANCOVA) geralmente permite testes mais sensíveis de 
efeitos de tratamento. 

Desigualdade de Bonferroni Técnica para ajustar o nível alfa 
selecionado para controle da taxa de erro Tipo | geral quando 
se executa uma série de testes separados. O procedimento 
envolve o cálculo de um novo valor crítico dividindo-se a taxa 
a proposta pelo número de testes estatísticos a serem exe- 
cutados. Por exemplo, se um nível de significância de 0,05 
é desejado para uma série de cinco testes separados, então 
uma taxa de 0,01 (0,05/5) é utilizada em cada um. 

Distribuição normal multivariada Generalização da distribui- 
ção normal univariada para o caso de p variáveis. Uma dis- 
tribuição normal multivariada de grupos de amostras é uma 
suposição básica exigida para a validade dos testes de sig- 
nificância em MANOVA (ver Capítulo 2 para mais discussão 
sobre este tópico). 

Efeito de interação Em planejamentos fatoriais, os efeitos 
conjuntos de duas variáveis de tratamento em adição aos 
efeitos principais individuais. Isso significa que a diferença 
entre grupos quanto a uma variável de tratamento varia de 
acordo com o nível da segunda variável de tratamento. Por 
exemplo, considere que os respondentes foram classifica- 
dos por renda (três níveis) e sexo (homens versus mulheres). 
Uma interação significante seria encontrada quando as di- 
ferenças entre homens e mulheres quanto à (s) variável(eis) 
independente(s) variassem substancialmente ao longo dos 
três níveis de renda. 

Efeito principal Em planejamentos fatoriais, o efeito individual 
de cada variável de tratamento sobre a variável dependente. 

Erro padrão Medida da dispersão das médias ou das diferen- 
ças das médias esperada devido à variação amostral. O erro 
padrão é usado no cálculo da estatística t. 

Erro Tipo | Probabilidade de rejeitar a hipótese nula quando 
ela deveria ser aceita, ou seja, concluir que duas médias são 
significantemente diferentes quando na verdade são iguais. 
Valores pequenos de alfa (p.ex., 0,05 ou 0,01), também deno- 
tados como q, levam à rejeição da hipótese nula e aceitação 
da hipótese alternativa de que as médias das populações não 
são iguais. 

Erro Tipo Il Probabilidade de se falhar na rejeição da hipótese 
nula quando ela deveria ser rejeitada, ou seja, concluir que 
duas médias não são significantemente diferentes quando na 
verdade o são. Também conhecido como erro beta (P). 

Estatística U Ver lambda de Wilks. 
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Estatística t Teste estatístico que avalia a significância estatísti- 
ca entre dois grupos em uma única variável dependente (ver 
teste d. 

Fator Variável independente não-métrica, também chamada de 
tratamento ou variável experimental. 

Fator de blocagem Característica de respondentes em ANO- 
VA ou MANOVA que é usada para reduzir a variabilidade 
interna do grupo tornando-se um fator adicional na análise. 
Muito frequentemente usada como uma variável de controle 
(ou seja, característica não incluída na análise, mas uma pela 
qual diferenças são esperadas ou propostas). Incluindo-se fa- 
tor de blocagem na análise, são formados grupos adicionais 
que são mais homogêneos e aumentam a chance de mostrar 
diferenças significantes. Como exemplo, considere que clien- 
tes são questionados sobre suas intenções de compra de um 
produto e que a medida independente empregada é idade. 
Experiência anterior mostrou que uma variação substancial 
em intenções de compras de outros produtos deste tipo era 
devida também a sexo. Logo, sexo poderia ser acrescenta- 
do como um fator adicional, de forma que cada categoria de 
idade fosse dividida em grupos de homens e mulheres com 
maior homogeneidade interna. 

Função discriminante Dimensão de diferença ou discriminação 
entre os grupos na análise MANOVA. A função discriminante é 
uma variável estatística das variáveis dependentes. 

Função de ligação Uma componente fundamental de GLM que 
especifica a transformação entre a variável estatística de va- 
riáveis independentes* e a distribuição especificada de pro- 
babilidade. Em MANOVA (e regressão), a ligação identidade 
é usada com uma distribuição normal, correspondendo a nos- 
sas suposições estatísticas de normalidade. 

Hipótese nula Hipótese com amostras que surgem de popu- 
lações com médias iguais (i.e., as médias de grupos são 
iguais) para uma variável dependente (teste univariado) ou 
um conjunto de variáveis dependentes (teste multivariado). A 
hipótese nula pode ser aceita ou rejeitada, dependendo dos 
resultados de um teste de significância estatística. 

Independência Suposição crítica de ANOVA ou MANOVA que 
requer que as medidas dependentes para cada respondente 
sejam totalmente não-correlacionadas com as respostas de 
outros respondentes na amostra. Uma falta de independência 
afeta severamente a validade estatística da análise a menos 
que uma ação corretiva seja realizada. 

Interação desordinal Forma de efeito de interação entre variá- 
veis independentes que invalida a interpretação dos efeitos 
principais dos tratamentos. Uma interação desordinal é mos- 
trada graficamente fazendo-se o gráfico das médias para 
cada grupo e fazendo-se a intersecção de retas. Nesse tipo 
de interação, as diferenças médias não apenas variam, dadas 
as combinações únicas de níveis de variável independente, 
mas a ordenação relativa de grupos também muda. 

Interação ordinal Tipo aceitável de efeito de interação no qual 
as magnitudes de diferenças entre grupos variam, mas as po- 
sições relativas dos grupos permanecem constantes. É grafi- 
camente representada com valores médios e observando-se 
retas não-paralelas que não se interceptam. 


*N. deR.T.: A frase correta seria “variáveis dependentes”. 


Lambda de Wilks Uma das quatro principais estatísticas para 
testar a hipótese nula em MANOVA. Também chamado de cri- 
tério de máxima verossimilhança ou estatística U. 

Maior raiz característica (gcr) Estatística para testar a hipótese 
nula em MANOVA. Ela testa a primeira função discriminante 
das variáveis dependentes em relação à sua habilidade de 
distinguir diferenças de grupos. 

Medidas repetidas Uso de duas ou mais respostas de um único 
indivíduo em uma análise ANOVA ou MANOVA. O propósito 
de um delineamento de medidas repetidas é controlar as di- 
ferenças de nível individual que possam afetar a variância in- 
terna no grupo. As medidas repetidas representam uma falta 
de independência que deve ser explicada de uma maneira 
especial na análise. 

Modelo linear geral (GLM) Procedimento generalizado de 
estimação baseado em três componentes: (1) uma variável 
estatística formada pela combinação linear de variáveis in- 
dependentes, (2) uma distribuição de probabilidade especi- 
ficada pelo pesquisador com base nas características das 
variáveis dependentes, e (3) uma função de ligação que de- 
nota a conexão entre a variável estatística e a distribuição de 
probabilidade. 

Nível de significância Ver alfa. 

Ortogonal Independência estatística ou ausência de associa- 
ção. As variáveis estatísticas ortogonais explicam a variância 
única, sem qualquer explicação de variância compartilhada 
entre elas. Contrastes ortogonais são comparações planeja- 
das estatisticamente independentes e representam compara- 
ções únicas de médias de grupos. 

Planejamento experimental Plano de pesquisa no qual o 
pesquisador manipula ou controla diretamente uma ou mais 
variáveis preditoras (ver tratamento ou fator) e avalia seus 
efeitos sobre as variáveis dependentes. Comum nas ciên- 
cias físicas, está se tornando popular nos negócios e em 
ciências sociais. Por exemplo, os respondentes são confron 
tados com anúncios separados que variam sistematicamen- 
te em uma característica, como diferentes apelos (emocional 
versus racional) ou tipos de apresentação (colorido versus 
preto-e-branco), e são então questionados sobre suas ati- 
tudes, avaliações ou sentimentos em relação aos diferentes 
anúncios. 

Planejamento fatorial Delingamento com mais de um fator (tra- 
tamento). Os planejamentos fatoriais examinam os efeitos de 
diversos fatores simultaneamente, formando grupos basea- 
dos em todas as possíveis combinações de níveis (valores) 
das diversas variáveis de tratamento. 

Poder Probabilidade de identificar um efeito de tratamento 
quando ele realmente existe na amostra. O poder é definido 
como 1 — B (ver beta). É determinado como uma função do 
nível de significância estatística (a) dado pelo pesquisador 
para um erro Tipo |, do tamanho da amostra usada na análise, 
e do tamanho do efeito sob exame. 

Replicação Administração repetida de um experimento com o 
intento de validar os resultados em uma outra amostra de res- 
pondentes. 

Tº de Hotelling Teste para avaliar a significância estatística da 
diferença nas médias de duas ou mais variáveis entre dois 
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grupos. É um caso especial de MANOVA usado com dois gru- 
pos ou níveis de uma variável de tratamento. 

Tamanho de efeito Medida padronizada de diferenças de gru- 
pos usada no cálculo de poder estatístico. Calculado como a 
diferença em médias de grupos dividida pelo desvio-padrão, 
é então comparável, em estudos de pesquisa, a uma medi- 
da generalizada de efeito (ou seja, diferenças em médias de 
grupos). 

Taxa de erro de experimento A taxa de erro combinado ou ge- 
ral que resulta da execução de múltiplos testes tou F que são 
relacionados (p.ex., testes t entre uma série de pares correla- 
cionados de variáveis, ou uma série de testes tentre os pares 
de categorias em uma variável multicotômica). 

Tratamento Variável independente (fator) que um pesquisador 
manipula para ver o efeito (se houver) sobre as variáveis de- 
pendentes. A variável de tratamento pode ter diversos níveis. 
Por exemplo, diferentes intensidades de apelos de publicida- 
de podem ser manipuladas para ver o efeito sobre a crença 
do cliente. 

Teste a priori Ver comparação planejada. 

Teste M de Box Teste estatístico para a igualdade de matrizes 
de variância-covariância das variáveis dependentes ao lon- 
go dos grupos. É sensível, especialmente diante da presença 
de variáveis não-normais. O uso de um nível de significância 
conservador (i.e., 0,01 ou menos) é sugerido como um ajuste 
para a sensibilidade da estatística. 

Teste post hoc Teste estatístico de diferenças de médias exe- 
cutado depois que os testes estatísticos para efeitos princi- 
pais foram realizados. Em geral, os testes post hoc não usam 
um único contraste, mas em vez disso testam diferenças entre 
todas as possíveis combinações de grupos. Ainda que for- 
neçam informação diagnóstica abundante, eles aumentam a 
taxa de erro Tipo | geral fazendo múltiplos testes estatísticos 
e, por isso, devem usar níveis de confiança muito estritos. 

Testet Teste para avaliar a significância estatística da diferença 
entre duas médias amostrais para uma única variável depen- 
dente. O teste té um caso especial de ANOVA para dois gru- 
pos ou níveis de uma variável de tratamento. 

Valor crítico Valor de um teste estatístico (teste 1, teste F) que 
denota um nível de significância especificado. Por exemplo, 
1,96 denota um nível de significância de 0,05 para o teste t 
com grandes amostras. 

Variável estatística Combinação linear de variáveis. Em MA- 
NOVA, as variáveis dependentes são formadas em variáveis 
estatísticas na(s) função(ões) discriminante(s). 

Vetor Conjunto de números reais (por exemplo, X.... X,)) que 
podem ser escritos em colunas ou linhas. Os vetores coluna 
são considerados convencionais, e os vetores linha são tidos 
como transpostos. Os vetores coluna e vetores linha são mos- 
trados como se segue: 


XT = [X,X 5X] 


Vetor coluna Vetor linha 


MANOVA: EXTENSÃO DOS MÉTODOS 
UNIVARIADOS PARA AVALIAÇÃO 
DE DIFERENÇAS DE GRUPOS 


Muitas vezes técnicas multivariadas são extensões de 
métodos univariados, como no caso da regressão múl- 
tipla, que estende a regressão simples (com apenas 
uma variável independente) a uma análise multivariada 
onde duas ou mais variáveis independentes podem ser 
usadas. Uma situação parecida é encontrada na análise 
de diferenças de grupos. Tais procedimentos são classi- 
ficados como univariados não por causa do número de 
variáveis independentes, mas por conta do número de 
variáveis dependentes. Em regressão múltipla, os ter- 
mos univariado e multivariado se referem à quantia de 
variáveis independentes, mas para ANOVA e MANO- 
VA a terminologia se aplica ao uso de uma ou múltiplas 
variáveis dependentes. Ambas as técnicas são há bas- 
tante tempo associadas com a análise de planejamentos 
experimentais. 

As técnicas univariadas para análise de diferenças 
de grupos são o teste t (2 grupos) e a análise de variân- 
cia (ANOVA) para 2 ou mais grupos. Os procedimentos 
multivariados equivalentes são o Tº de Hotelling e a aná- 
lise multivariada de variância, respectivamente. As rela- 
ções entre os procedimentos univariado e multivariado 
são como se segue: 


Número de variáveis 
dependentes 
Número de grupos em Uma Duas ou mais 
variável independente (univariada) (multivariada) 
Dois grupos (caso Teste t T' de 
especializado) Hotelling 
Dois ou mais grupos Análise de Análise 
(caso generalizado) variância multivariada 
(ANOVA) de variância 
(MANOVA) 


O teste te o Tº de Hotelling (ver discussões mais de- 
talhadas em seções adiante) são retratados como casos 
especializados no sentido de serem limitados à avaliação 
de apenas dois grupos (categorias) para uma variável in- 
dependente, ao passo que ANOVA e MANOVA tam- 
bém podem lidar com situações de dois grupos, bem como 
análises nas quais as variáveis independentes têm mais de 
dois grupos. Antes de proceder com nossa discussão dos 
aspectos únicos de MANOVA, examinamos os princípios 
básicos das técnicas univariadas. 


Procedimentos univariados para 
avaliação de diferenças de grupos 


A discussão a seguir aborda os dois tipos mais comuns de 
procedimentos univariados, o teste t, que compara uma 
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variável dependente ao longo de dois grupos, e ANOVA, 
usada sempre que o número de grupos é dois* ou mais. 


O teste t 

O teste t avalia a significância estatística da diferença en- 
tre duas médias de amostras independentes para uma úni- 
ca variável dependente. Ao descrevermos os elementos 
básicos do teste t e outros testes de diferenças de grupos, 
abordamos dois tópicos: planejamento da análise e teste 
estatístico. 


Planejamento da análise. A diferença em escores médios 
de grupos é o resultado de designar observações (p.ex., res- 
pondentes) a um dos dois grupos com base em seus valores 
de uma variável não-métrica conhecida como fator (tam- 
bém chamada de tratamento). Um fator é uma variável 
não-métrica, muitas vezes empregada em um planejamen- 
to experimental no qual ela é manipulada com categorias 
ou níveis pré-especificados que são propostos para refletir 
diferenças em uma variável dependente. Um fator pode 
também ser apenas uma variável não-métrica observada, 
como sexo. Em qualquer caso, a análise é fundamental- 
mente a mesma. Um exemplo de um planejamento experi- 
mental simples será usado para ilustrar tal análise: 


Um pesquisador está interessado em como dois diferen- 
tes anúncios — um informativo e outro emocional — afe- 
tam o apelo dos mesmos. Para avaliar as possíveis dife- 
renças, dois anúncios refletindo os diferentes apelos são 
preparados. Respondentes são em seguida escolhidos ao 
acaso para receber o anúncio informativo ou o emoti- 
vo. Depois de examinarem o anúncio, cada respondente 
deve avaliar o apelo da mensagem em uma escala de 10 
pontos, sendo que 1 é pobre e 10 é excelente. 


As duas diferentes mensagens representam um único 
fator experimental com dois níveis (informativo versus 
emocional). A avaliação de apelo se torna a variável de- 
pendente. A meta é determinar se os respondentes que 
examinaram o anúncio informativo têm uma avaliação de 
apelo significativamente diferente do que aqueles que vi- 
ram o anúncio com a mensagem emocional. Neste caso, o 
fator foi experimentalmente manipulado (ou seja, os dois 
níveis de tipo de mensagem foram criados pelo pesqui- 
sador), mas o mesmo processo básico poderia ser usado 
para examinar diferença em uma variável dependente 
para quaisquer dois grupos de respondentes (p.ex., ho- 
mens versus mulheres, clientes versus não-clientes etc.). 
Com os respondentes designados a grupos com base em 
seus valores do fator, o próximo passo é avaliar se as dife- 
renças entre os grupos em termos da variável dependente 
são estatisticamente significantes. 


*N. de R. T.: A frase correta seria “sempre que o número de grupos 
é três ou mais”. 


Teste estatístico. Para determinar se o tratamento tem 
um efeito (ou seja, os dois anúncios têm diferentes níveis 
de apelo?), um teste estatístico é executado sobre as dife- 
renças entre os escores médios (i.e., avaliação de apelo) 
para cada grupo (aqueles que vêem os anúncios emocio- 
nais versus aqueles que vêem os informativos). 


Cálculo da estatística t. A medida usada é a estatís- 
tica t, definida neste caso como a razão da diferença entre 
as médias da amostra (ju, — .,) e seu erro padrão. O erro 
padrão é uma estimativa da diferença entre médias a ser 
esperada por conta de erro amostral. Se a diferença real 
entre as médias de grupos é suficientemente maior do que 
o erro padrão, então podemos concluir que essas dife- 
renças são estatisticamente significantes. Abordamos na 
próxima seção qual nível da estatística t é necessário para 
significância estatística, mas primeiro podemos expressar 
o cálculo na equação a seguir: 

estatística t = o 
E 


HH, 


onde 


u,= média do grupo 1 
Lt, = média do grupo 2 
SEuu,= erro padrão da diferença em médias de grupos 


Em nosso exemplo, calcularíamos primeiramente o es- 
core médio da avaliação de apelo para cada grupo de 
respondentes (informativo versus emocional) e em segui- 
da encontraríamos a diferença em seus escores médios 
(intormativo — Hemocional)- Formando a razão de diferença real 
entre as médias com a diferença esperada devido a erro 
amostral (o erro padrão), quantificamos o impacto real 
do tratamento que é devido a erro de amostragem alea- 
tória. Em outras palavras, o valor t, ou estatística t, repre- 
senta a diferença de grupo em termos de erros padrão. 


Interpretação da estatística t. Quão grande deve 
ser o valor t para se considerar a diferença estatistica- 
mente significante (ou seja, a diferença não era devido 
à variabilidade amostral, mas representa uma diferença 
verdadeira)? Essa determinação é feita comparando-se a 
estatística t com o valor crítico da estatística 1 (t,,;,). Deter- 
minamos o valor crítico (t...) para nossa estatística t e tes- 
tamos a significância estatística das diferenças observadas 


pelo seguinte procedimento: 


1. Computamos a estatística t como a razão da diferença entre 
médias amostrais e seu erro padrão. 

2. Especificamos um nível de erro Tipo I (denotado como alfa, 
q, ou nível de significância), que indica o nível de probabi- 
lidade que o pesquisador aceitará para concluir que as mé- 
dias de grupos são diferentes quando na verdade não o são. 
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3. Determinamos o valor crítico (t,..,) referente à distribuição 
t com N, + N,- 2 graus de liberdade e um à especificado, 
onde N, e N,são tamanhos de amostras. Apesar de o pesqui- 
sador poder usar as tabelas estatísticas para descobrir o va- 
lor exato, diversos valores típicos são empregados quando o 
tamanho total da amostra (N,+N,) é pelo menos maior que 
50. O que se segue são alguns níveis « amplamente usados e 


os correspondentes valores 


crit” 


o (Nível de significância) Valor t,; 
0,10 1,64 
0,05 1,96 
0,01 2,58 


4. Se o valor absoluto da estatística t calculada exceder t,.;,, O pes- 
quisador pode concluir que os dois grupos revelam diferenças 
em médias de grupos na medida dependente (ou seja, uy = 
E”), com uma probabilidade de erro Tipo I de a. O pesquisa- 
dor pode então examinar os valores médios reais para deter- 
minar qual grupo é maior no valor dependente. 

Os programas de computador atuais fornecem o valor 
t calculado e o nível de significância associado, tornando a 
interpretação ainda mais fácil. O pesquisador apenas preci- 
sa ver se o nível de significância atende ou excede o nível de 
erro Tipo I estabelecido pelo pesquisador. 


O teste t é amplamente usado por funcionar com gru- 
pos pequenos em tamanho e é muito fácil de aplicar e in- 
terpretar. Ele enfrenta poucas limitações: (1) ele acomoda 
somente dois grupos, e (2) ele pode avaliar apenas uma 
variável independente por vez. Para remover alguma ou 
ambas dessas restrições, o pesquisador pode utilizar análi- 
se de variância, a qual pode testar variáveis independentes 
com mais de dois grupos e ainda avaliar simultaneamente 
duas ou mais variáveis independentes. 


Análise de variância 

Em nosso exemplo do teste t, um pesquisador expôs dois 
grupos de respondentes a diferentes anúncios e em segui- 
da pediu que avaliassem o nível de apelo dos anúncios em 
uma escala de 10 pontos. Suponha que estejamos inte- 
ressados em avaliar três mensagens, em vez de duas. Os 
respondentes seriam aleatoriamente designados a um dos 
três grupos, e teríamos três médias de amostras para com- 
parar. Para analisar esses dados, poderíamos ser tentados 
a conduzir testes í separados para a diferença entre cada 
par de médias (ou seja, grupo 1 versus grupo 2; grupo 1 
versus grupo 3; e grupo 2 versus grupo 3). 

No entanto, múltiplos testes t aumentam a taxa de erro 
Tipo I geral (discutimos isso em mais detalhes na próxima 
seção). A análise de variância (ANOVA) evita essa infla- 
ção do erro Tipo I ao fazerem múltiplas comparações de 
grupos de tratamento, determinando em um único teste 
se o conjunto inteiro de médias de amostras sugere que 
as amostras foram obtidas a partir da mesma população 
geral. Ou seja, ANOVA é empregada para determinar a 


* N.de R.T.: A expressão certa é u, * 1. 


probabilidade de que diferenças em médias ao longo de 
diversos grupos ocorrem apenas devido a erro amostral. 


Planejamento de análise. ANOVA oferece conside- 
ravelmente maior flexibilidade no teste de diferenças de 
grupos do que o teste 1. Ainda que um teste t possa ser 
executado com ANOVA, o pesquisador tem também a 
habilidade para testar diferenças em mais de dois grupos, 
bem como testar mais de uma variável independente. Fa- 
tores não são limitados a apenas dois níveis, mas podem 
ter quantos níveis (grupos) que se queira. Além disso, a 
habilidade de analisar mais de uma variável independen- 
te permite ao pesquisador uma visão mais analítica sobre 
questões complexas de pesquisa que não poderiam ser 
abordadas pela análise de apenas uma variável indepen- 
dente por vez. 

Com essa maior flexibilidade surgem, porém, proble- 
mas extras. O mais importante se refere às exigências de 
tamanho de amostra a partir do aumento do número de 
níveis ou de variáveis independentes. Para cada grupo, 
um pesquisador desejará ter uma amostra de aproximada- 
mente 20 observações (uma discussão mais detalhada se 
encontra em uma seção posterior). Desse modo, aumen- 
tar o número de níveis em qualquer fator demanda um 
aumento no tamanho da amostra. Além disso, a análise 
de múltiplos fatores pode criar uma situação de exigências 
por grandes amostras de maneira muito rápida. Lembre- 
se, quando dois ou mais fatores são incluídos na análise, 
o número de grupos formados é o produto do número de 
níveis, e não a soma (ou seja, Número de grupos = Núme- 
ro de níveis,,o 1 X Número de níveis, 2). Um exemplo 
simples ilustra a questão. 


Os dois níveis de anúncio publicitário (informativo e 
emocional) requerem uma amostra total de 50 se o pes- 
quisador desejar 25 respondentes por célula. Agora, 
considere que um segundo fator é acrescentado quanto 
à colorização do anúncio em três níveis (1 = colorido, 2 = 
preto e branco, 3 = combinação de ambos). Se os dois fa- 
tores são agora incluídos na análise, o número de grupos 
aumenta para seis (Número de grupos = 2x3) e a amos- 
tra cresce para 150 respondentes (Tamanho amostral = 
6 grupos x 25 respondentes por grupo). Assim, perce- 
bemos que o acréscimo de um fator de três níveis pode 
aumentar a complexidade e a amostra exigida. 


Logo, pesquisadores devem ser cuidadosos quando 
determinam o número de níveis para um fator, bem como 
o número de fatores incluídos, especialmente quando se 
analisam pesquisas de campo, onde a habilidade de conse- 
guir um tamanho necessário de amostra por célula é mui- 
to mais difícil do que em condições sob controle. 


Teste estatístico. A lógica de um teste ANOVA é bas- 
tante simples. Como o nome análise de variância sugere, 


CAPÍTULO 6 Análise Multivariada de Variância 309 


duas estimativas independentes da variância para a va- 
riável dependente são comparadas. A primeira reflete a 
variabilidade geral de respondentes dentro dos grupos 
(MS), e a segunda representa as diferenças entre grupos 
atribuíveis aos efeitos de tratamento (MS,): 


e Estimativa de variância dentro de grupos (MSy: quadrado 
médio dentro dos grupos): Essa estimativa da variabilida- 
de média dos respondentes quanto à variável dependente 
dentro de um grupo de tratamento é baseada em desvios de 
escores individuais a partir de suas respectivas médias de 
grupos. A MSy é comparável ao erro padrão entre duas mé- 
dias calculadas no teste t, uma vez que representa a variabi- 
lidade dentro dos grupos. O valor MS, às vezes é chamado 
de variância de erro. 

e Estimativa de variância entre grupos (MS,: quadrado mé- 
dio entre grupos): A segunda estimativa de variância é a 
variabilidade das médias de grupos de tratamento quanto 
à variável dependente. Baseia-se em desvios de médias de 
grupos a partir da grande média geral de todos os escores. 
Sob a hipótese nula de inexistência de efeitos de tratamen- 
to (ou seja, py = &; = 1; =... = py), essa estimativa de 
variância, diferente da MS, reflete quaisquer efeitos de 
tratamento que existam; em outras palavras, diferenças 
em médias de tratamentos aumentam o valor esperado da 
MS,. Note que qualquer número de grupos pode ser aco- 
modado. 


Cálculo da estatística F. A razão entre MS,e MSy 
é uma medida de quanta variância é atribuível aos dife- 
rentes tratamentos versus a variância esperada a partir de 
amostragem aleatória. A razão entre MS,e MS é concei- 
tualmente semelhante ao valor t, mas neste caso nos dá 
um valor para a estatística F. 


MS 
Estatística F = E 
MS 


W 


Como as diferenças entre grupos tendem a inflacionar 
MsS,, grandes valores da estatística F levam à rejeição da 
hipótese nula de inexistência de diferença em médias de 
grupos. Se a análise tem diversos tratamentos diferentes 
(variáveis independentes), então estimativas de MS, são 
calculadas para cada tratamento, bem como estatísticas F. 
Isso permite a avaliação separada de cada tratamento. 


Interpretação da estatística F. Para determinar se 
a estatística F é suficientemente grande para justificar a 
rejeição da hipótese nula (o que significa que diferenças 
estão presentes entre os grupos), siga um processo pareci- 
do com o teste t: 


1. Determine o valor crítico para a estatística F (F...) usando a 
distribuição F com (k — 1) e (N — k) graus de liberdade para 
um nível especificado de a (onde N= N,+...+ Ne k=nú- 
mero de grupos). Como ocorre com o teste t, um pesquisa- 
dor pode usar certos valores F como diretrizes gerais quan- 
do as amostras são relativamente grandes. Esses valores são 
simplesmente t.,;, ao quadrado, resultando no seguinte: 


crit 


o (Nível de significância) Valor F,. 
0,10 2,68 
0,05 3,84 
0,01 6,63 


2. Calcule a estatística F ou encontre o valor F calculado pelo 
programa de computador. 

3. Se o valor calculado da estatística F exceder F,,,, conclua 
que as médias ao longo de todos os grupos não são todas 
iguais. Novamente, os programas computacionais fornecem 
o valor Fe o correspondente nível de significância, de modo 
que o pesquisador pode diretamente avaliar se ele alcança 
um nível aceitável. 


O exame das médias de grupos então viabiliza ao pes- 
quisador a avaliação da posição relativa de cada grupo 
quanto à medida dependente. Apesar de o teste estatís- 
tico F avaliar a hipótese nula de médias iguais, ele não 
aborda a questão de quais médias são diferentes. Por 
exemplo, em uma situação de três grupos, todos eles po- 
dem diferir significantemente, ou dois podem ser iguais, 
mas diferirem do terceiro. Para avaliar essas diferenças, 
o pesquisador pode empregar comparações planejadas 
ou testes post hoc. Examinamos cada um desses métodos 
posteriormente. 


Procedimentos multivariados para 
avaliação de diferenças de grupos 


Como procedimentos de inferência estatística, tanto 
as técnicas univariadas (teste te ANOVA) quanto suas 
extensões multivariadas (T” de Hotelling e MANOVA) 
são utilizadas para avaliar a significância estatística de 
diferenças entre grupos. No teste te ANOVA, a hipóte- 
se nula testada é a igualdade de médias de uma variável 
dependente ao longo de grupos. Nas técnicas multivaria- 
das, a hipótese nula testada é a igualdade de vetores de 
médias sobre múltiplas variáveis dependentes ao longo de 
grupos. A distinção entre as hipóteses testadas em ANO- 
VA e MANOVA é ilustrada na Figura 6-1. No caso uni- 
variado, uma única medida dependente é testada quanto 
à igualdade ao longo de grupos. No caso multivariado, 
uma variável estatística é testada quanto a igualdade. O 
conceito de variável estatística tem sido instrumental em 
nossas discussões das técnicas multivariadas anteriores e é 
abordado em detalhes no Capítulo 1. 

Em MANOVA, o pesquisador na verdade tem duas 
variáveis estatísticas, uma para as variáveis dependentes 
e outra para as independentes. A variável estatística de 
variáveis dependentes é de maior interesse porque as me- 
didas dependentes métricas podem ser reunidas em uma 
combinação linear, como já vimos na regressão múltipla 
e na análise discriminante. O aspecto único de MANO- 
VA é que a variável estatística combina de maneira ótima 
as múltiplas medidas dependentes em um único valor que 
maximiza as diferenças ao longo dos grupos. 
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ANOVA 


Ho: y=o= ... ty 


Hipótese nula (Hb) = todas as médias de grupos são iguais, 
ou seja, elas se originam da mesma população. 


MANOVA 
Ha Hz Hik 
Has Hoo Hok 
Ho: = RR = 
Hp1 Hp Hpk 


Hipótese nula (Ho) = todos os vetores de médias de grupos são 
iguais, ou seja, eles se originam da mesma população. 


Hpk = médias da variável p, grupo k 


FIGURA 6-1 Teste da hipótese nula de ANOVA e de MANOVA. 


O caso de dois grupos: T' de Hotelling 

Em nosso exemplo univariado anterior, os pesquisado- 
res estavam interessados no apelo de duas mensagens 
de anúncios. Mas e se eles também quisessem conhecer 
a intenção de compra gerada pelas duas mensagens? Se 
fossem usadas apenas análises univariadas, os pesqui- 
sadores fariam testes t separados sobre as avaliações de 
apelo e intenção de compra geradas pelos anúncios. En- 
tretanto, as duas medidas estão inter-relacionadas; logo, 
o que realmente se deseja é um teste das diferenças entre 
as mensagens nas duas variáveis coletivamente. Esse é o 
momento em que o T' de Hotelling, uma forma especiali- 
zada de MANOVA que é uma extensão direta do teste t 
univariado, pode ser usado. 


Controle para a taxa de erro Tipo IL. O T' de Hotelling 
fornece um teste estatístico da variável estatística forma- 
da a partir das variáveis dependentes, que produz a maior 
diferença de grupos. Ele também aborda o problema de 
inflacionar o nível de erro Tipo I que surge quando se faz 
uma série de testes t de médias de grupos sobre diversas 
medidas dependentes. Ele controla essa inflação de nível 
de erro Tipo I, fornecendo um teste geral único de dife- 
renças de grupos ao longo de todas as variáveis dependen- 
tes em um nível q especificado. 

Como o Tº de Hotelling atinge esses objetivos? Consi- 
dere a seguinte equação para uma variável estatística das 
variáveis dependentes: 


C-WX+WAÃ+.+WX, 


non 


onde 


C= escore composto ou multivariado para um res- 
pondente 

W,= peso para a variável dependente i 

X,= variável dependente i 


Em nosso exemplo, as avaliações de apelo de mensagem 
são combinadas com as intenções de compra para formar 
a composição. Para qualquer conjunto de pesos, podería- 
mos computar escores compostos para cada respondente e 
então calcular uma estatística t ordinária para a diferença 
entre grupos quanto aos escores compostos. No entanto, 
se conseguíssemos achar um conjunto de pesos que desse 
o valor máximo à estatística t para esse conjunto de dados, 
esses pesos seriam os mesmos da função discriminante en- 
tre os dois grupos (como mostrado no Capítulo 5). A esta- 
tística t máxima que resulta a partir dos escores compostos 
produzidos pela função discriminante pode ser elevada ao 
quadrado para produzir o valor Tº de Hotelling [11]. 


A fórmula computacional para o Tº de Hotelling repre- 
senta os resultados de derivações matemáticas emprega- 
das para se chegar à estatística t máxima (e, implicitamen- 
te, à combinação linear mais discriminante das variáveis 
dependentes). Isso equivale a dizer que se encontrarmos 
uma função discriminante para os dois grupos que produ- 
za um Tº significante, os dois grupos serão considerados 
diferentes ao longo dos vetores de médias. 


Teste estatístico. Como o Tº de Hotelling fornece um 
teste da hipótese de nenhuma diferença de grupos nos 
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vetores de escores médios? Assim como a estatística t 
segue uma distribuição conhecida sob a hipótese nula de 
nenhum efeito de tratamento sobre uma única variável 
dependente, o Tº de Hotelling segue uma distribuição co- 
nhecida sob a hipótese nula de nenhum efeito de trata- 
mento sobre qualquer uma de um conjunto de medidas 
dependentes. Essa distribuição se transforma em uma dis- 
tribuição F com pe N,+ N,-2 —1 graus de liberdade após 
ajuste (onde p = número de variáveis dependentes). Para 
conseguir o valor crítico para o Tº de Hotelling, encontra- 
mos o valor tabelado para Fem um nível a especificado 
e computamos 7”, como se segue: 


crit 
NA+4+N —-2 

ma : : XE, 
NA+N,-p-1 


O caso de k grupos: MANOVA 

Assim como ANOVA é uma extensão do teste t, MA- 
NOVA pode ser considerada uma extensão do procedi- 
mento Tº de Hotelling. Criamos pesos para as variáveis 
dependentes para produzir um escore da variável estatís- 
tica para cada respondente que é maximamente diferente 
ao longo de todos os grupos. Muitas das mesmas questões 
sobre planejamento de análise discutidas em ANOVA se 
aplicam em MANOVA, mas o método de teste estatístico 
difere sensivelmente de ANOVA. 


Planejamento de análise. Todos os aspectos do pla- 
nejamento da análise discutidos anteriormente para 
ANOVA (número de níveis por fator, quantia de fato- 
res etc.) também se aplicam a MANOVA. Além disso, 
o número de variáveis dependentes e as relações entre 
essas medidas dependentes levantam questões adicio- 
nais que são discutidas adiante. MANOVA permite ao 
pesquisador que o mesmo avalie o impacto de múltiplas 
variáveis independentes sobre as variáveis dependentes 
não somente individualmente, mas também coletiva- 
mente. 


Teste estatístico. No caso de dois grupos, uma vez que a 
variável estatística é formada, os procedimentos de ANO- 
VA são basicamente usados para identificar se há diferen- 
ças. Com três ou mais grupos (tendo uma única variável 
independente com três níveis ou usando duas ou mais va- 
riáveis independentes), a análise de diferenças de grupos 
fica mais próxima da análise discriminante (ver Capítu- 
lo 5). Para três ou mais grupos, assim como em análise 
discriminante, variáveis estatísticas múltiplas de medidas 
dependentes são formadas. A primeira variável estatísti- 
ca, chamada de função discriminante, especifica um con- 
junto de pesos que maximiza as diferenças entre grupos, 
maximizando portanto o valor F. O valor F máximo em 
si nos permite computar diretamente o que se chama de 
estatística da maior raiz característica (gcr), a qual viabili- 
za o teste estatístico da primeira função discriminante. A 


estatística da maior raiz característica pode ser calculada 
como [11]: 


ger=(k-1) Fl (N-k). 


Para obter um único teste da hipótese de inexistência 
de diferenças de grupos nesse primeiro vetor de escores 
médios, poderíamos apelar para tabelas da distribuição 
gcr. Assim como a estatística F segue uma distribuição 
conhecida sob a hipótese nula de médias equivalentes de 
grupos sobre uma variável dependente, a estatística gcr 
segue uma distribuição conhecida sob a hipótese nula de 
vetores equivalentes de médias de grupos (ou seja, as mé- 
dias de grupos são equivalentes em um conjunto de me- 
didas dependentes). Uma comparação do gcr observado 
com o gcr..; nos fornece uma base para rejeitar a hipótese 
nula geral de vetores equivalentes de médias de grupos. 

Quaisquer funções discriminantes subsequentes são 
ortogonais: elas maximizam as diferenças entre grupos 
com base na variância remanescente não explicada pela(s) 
função(ões) anterior(es). Assim, em muitos casos, o teste 
para diferenças entre grupos envolve não apenas o pri- 
meiro escore de variável estatística, mas um conjunto de 
escores de variável estatística que são avaliados simulta- 
neamente. Em tais casos, há diversos testes multivariados 
disponíveis (p.ex., lambda de Wilks, critério de Pillai), 
cada um mais adequado a situações específicas para testes 
dessas múltiplas variáveis estatísticas. 


ax 


Diferenças entre MANOVA e análise discriminante 
Observamos anteriormente que, em teste estatístico, MA- 
NOVA emprega uma função discriminante, a qual é a va- 
riável estatística de medidas dependentes que maximiza 
a diferença entre grupos. Pode surgir a questão: qual é a 
diferença entre MANOVA e análise discriminante? Em 
alguns aspectos, MANOVA e análise discriminante são 
imagens espelhadas. As variáveis dependentes em MA- 
NOVA (um conjunto de variáveis métricas) são as variá- 
veis independentes em análise discriminante, e a variável 
dependente não-métrica da análise discriminante se torna 
a variável independente em MANOVA. Além disso, am- 
bas usam os mesmos métodos na formação de variáveis 
estatísticas e na avaliação da significância estatística entre 
grupos. 

As diferenças, entretanto, se concentram em torno dos 
objetivos das análises e do papel da(s) variável(eis) não- 
métricas. 


e A análise discriminante emprega uma única variável não- 
métrica como dependente. As categorias da variável depen- 
dente são assumidas como dadas, e as variáveis indepen- 
dentes são empregadas para formar variáveis estatísticas 
que diferem maximamente entre os grupos formados pelas 
categorias da variável dependente. 

e MANOVA usa o conjunto de variáveis métricas como as 
variáveis dependentes, e o objetivo passa a ser encontrar 
grupos de respondentes que exibam diferenças no conjun- 
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to de variáveis dependentes. Os grupos de respondentes 
não são pré-especificados; ao invés disso, o pesquisador usa 
uma ou mais variáveis independentes (não-métricas) para 
formar grupos. MANOVA, mesmo enquanto forma esses 
grupos, ainda mantém a habilidade de avaliar o impacto de 
cada variável não-métrica separadamente. 


UMA ILUSTRAÇÃO 
HIPOTÉTICA DE MANOVA 


Um exemplo simples pode ilustrar os benefícios de se usar 
MANOVA e também mostrar o uso de duas variáveis in- 
dependentes para avaliar diferenças em duas variáveis 
dependentes. 


Considere que a agência publicitária da HBAT identi- 
ficou duas características de anúncios da empresa (tipo 
de produto sendo anunciado e tipo de cliente) que eles 
imaginaram que causariam diferenças na maneira como 
as pessoas avaliam os anúncios. Eles pediram ao depar- 
tamento de pesquisa para desenvolver e executar um es- 
tudo para avaliar o impacto dessas características sobre 
as avaliações de anúncios. 


Planejamento de análise 

Ao planejar o estudo, a equipe de pesquisa definiu os se- 
guintes elementos relacionados a fatores utilizados, variá- 
veis dependentes e tamanho de amostra: 


e Fatores: Dois fatores foram identificados como re- 
presentando Tipo de produto e Tipo do cliente. Para 


cada fator, dois níveis foram também definidos: tipo de 
produto (produto 1 versus produto 2) e tipo de cliente 
(cliente atual versus ex-cliente). Ao combinar essas 
duas variáveis, conseguimos quatro grupos distintos: 


Tipo de produto 
Tipo do cliente Produto 1 Produto 2 
Cliente atual Grupo 1 Grupo 2 
Ex-cliente Grupo 3 Grupo 4 


e Variáveis dependentes: Avaliação dos anúncios HBAT 
usou duas variáveis (habilidade para ganhar atenção e 
persuasão) medidas em uma escala de 10 pontos. 

e Amostra: Respondentes foram expostos aos anúncios 
e avaliaram os mesmos quanto às duas medidas depen- 
dentes (ver Tabela 6-1). 


Diferenças da análise discriminante 


Apesar de MANOVA construir a variável estatística e 
analisar diferenças de uma maneira semelhante à análise 
discriminante, as duas técnicas diferem sensivelmente em 
como os grupos são formados e analisados. Usemos este 
exemplo para ilustrar tais diferenças: 


e Com análise discriminante, poderíamos examinar apenas 
as diferenças no conjunto de quatro grupos, sem distinção 
quanto às características dos mesmos (tipo de produto ou 
tipo de cliente). O pesquisador seria capaz de determinar 
se a variável estatística difere significativamente somente 
ao longo dos grupos, mas não poderia avaliar quais carac- 
terísticas dos grupos se relacionam a tais diferenças. 

e Com MANOVA, porém, o pesquisador analisa as 
diferenças nos grupos enquanto também avalia se as 


(Continua) 
TABELA 6-1 Exemplo hipotético de MANOVA 
Produto 1 Produto 2 
E = 3,50 esa = 4,50 ER =5,50 comp = 5,625 
X rota = 8,00 Xota= 11,125 
Tipo de cliente/Linha de 
produto Identificação Atenção Compra Total Identificação Atenção Compra Total 
Ex-cliente 1 1 3 4 5 3 4 7 
ER 3,00 2 2 1 4 6 4 3 7 
Xompra= 3,25 3 2 3 5 7 4 5 9 
Kas 6,25 4 3 2 5 8 5 5 10 
Média 2,0 2,25 4,25 4,0 4,25 8,25 
Cliente 9 4 7 11 13 6 7 13 
Xembrança= 6,00 10 5 6 11 14 7 8 15 
E ompra= 6,875 11 5 7 12 15 7 7 14 
Kas 12,875 12 6 7 13 16 8 6 14 
Média 5,0 6,75 11,75 7,0 7,0 14,0 


Valores são respostas em uma escala de 10 pontos (1 = Baixo, 10 = Alto). 
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(Continuação) . , . 
mesmas são devido ao tipo de produto, de cliente ou 


ambos. Logo, MANOVA se concentra na análise da 
composição dos grupos com base em suas características 
(as variáveis independentes). 


MANOVA permite ao pesquisador propor um plane- 
jamento mais complexo de pesquisa usando qualquer nú- 
mero de variáveis não-métricas independentes (dentro de 
limites) para formar grupos e então procurar diferenças 
significantes na variável estatística dependente associada 
a variáveis não-métricas específicas. 


Formação da variável estatística 
e avaliação das diferenças 


Com MANOVA podemos combinar múltiplas medidas 
dependentes em uma única variável estatística que será 
então avaliada quanto a diferenças em uma ou mais variá- 
veis independentes. Vejamos como uma variável estatísti- 
ca é formada e utilizada em nosso exemplo. 


Considere para este exemplo que as duas medidas de- 
pendentes (lembrança e compra) fossem igualmente 
ponderadas quando somadas no valor da variável esta- 
tística (variável estatística total = ESCOTE, ,pitidade de conquistar 


atenção + ESCOTE persuasão)» Este primeiro passo é idêntico à 
análise discriminante e fornece um valor composto com 
as variáveis ponderadas para atingir diferenças máximas 
entre os grupos. 

Com a variável estatística formada, podemos agora 
calcular médias para cada um dos quatro grupos, bem 
como as médias gerais para cada nível. A partir da Tabe- 
la 6-1 podemos identificar diversos padrões: 


e As quatro médias de grupos para a variável composta 
total (ou seja, 4,25, 8,25, 11,75 e 14,0) variam significati- 
vamente entre os grupos, sendo bastante diferenciáveis 
entre si. Se fôssemos usar análise discriminante com 
esses quatro grupos especificados como a medida de- 
pendente, esta determinaria que diferenças significantes 
surgiram na variável composta e também que ambas as 
variáveis dependentes* (lembrança e compra) contri- 
buíram para tais diferenças. A despeito disso, ainda não 
teríamos qualquer visão sobre como as duas variáveis 
independentes contribuíram para essas diferenças. 

e MANOVA, porém, vai além da análise das diferenças 
ao longo de grupos, avaliando se tipo de produto e/ou 
tipo de cliente criaram grupos com essas diferenças. 
Isso é obtido calculando-se as médias de categoria (de- 
notadas pelo símbolo IB), que são mostradas na Figura 


(Continua) 


* N.deR.T.: A frase correta seria “ambas as variáveis independentes”. 


1 1 Xoroduto 2 


Xax-cliente | 


3 l 


Xoroduto 1 


Produto 2 


Ex 


cliente 


Produto 1 


Ex-cliente 


Cliente 


FIGURA 6-2 Representação gráfica de médias de grupo da variável estatística (total) para exemplo hipotético. 
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6-2 com as médias individuais de grupos (as duas linhas 


conectam os grupos — ex-cliente e cliente — para os pro- 
dutos 1 e 2). Se olharmos para o tipo de produto (igno- 
rando distinções quanto ao tipo de cliente), poderemos 
ver um valor médio de 8,0 para os usuários do produto 1 
e um valor médio de 11,125 para os usuários do produto 
2. Do mesmo modo, para o tipo de cliente, os ex-clien- 
tes têm um valor médio de 6,25, e os clientes, de 12,875. 
A inspeção visual sugere que essas médias de categoria 
mostram diferenças significantes, com as diferenças 
para tipo de cliente (12,875 — 6,25 = 6,625) maiores do 
que para produto (11,125 — 8,00 = 3,125). 


Por ser capaz de representar essas médias de categoria 
de variável independente na análise, MANOVA não ape- 
nas mostra que diferenças gerais entre os quatro grupos 
ocorrem (como foi feito com a análise discriminante), mas 
também que tanto o tipo de cliente quanto o tipo de pro- 
duto contribuem significantemente para formar tais gru- 
pos distintos. Logo, as duas características “provocam” 
diferenças significantes, uma descoberta impossível com 
a análise discriminante. 


UM PROCESSO DE DECISÃO 
PARA MANOVA 


O processo de executar uma análise multivariada de va- 
riância é semelhante ao encontrado em muitas outras 
técnicas multivariadas e por isso pode ser descrito por 
meio do processo de seis estágios para a construção de 
modelo descrito no Capítulo 1. O processo começa com a 
especificação dos objetivos da pesquisa. Segue então com 
várias questões do projeto que uma análise multivariada 
demanda e prossegue com uma análise das suposições 
inerentes a MANOVA. Com tais questões abordadas, 
o processo continua com a estimação do modelo MA- 
NOVA e a avaliação do ajuste geral do modelo. Quando 
um modelo MANOVA aceitável é encontrado, os resul- 
tados podem ser interpretados em maiores detalhes. O 
passo final envolve esforços para validar os resultados 
para garantir generalização para a população. A Figura 
6-3 (estágios 1-3) e a Figura 6-4 (estágios 4-6, mostrados 
adiante no texto) fornecem uma representação gráfica 
do processo, que será discutido em detalhes nas próxi- 
mas seções. 


ESTÁGIO 1: OBJETIVOS DE MANOVA 


A seleção de MANOVA é baseada no desejo de analisar 
uma relação de dependência representada como as dife- 
renças em um conjunto de medidas dependentes ao longo 
de uma série de grupos formados por uma ou mais medi- 
das independentes categóricas. Desse modo, MANOVA 


representa uma poderosa ferramenta analítica adequada 
a uma ampla colocação de questões de pesquisa. Se em- 
pregada em situações reais ou quase experimentais (como 
pesquisas de campo ou investigações nas quais as medidas 
independentes são categóricas), MANOVA pode forne- 
cer idéias não apenas sobre a natureza e o poder preditivo 
das medidas independentes, mas também sobre as inter- 
relações e diferenças percebidas no conjunto de medidas 
dependentes. 


Quando devemos usar MANOVA? 


Com a habilidade de examinar diversas medidas depen- 
dentes simultaneamente, o pesquisador pode se benefi- 
ciar do uso de MANOVA de diversas maneiras. Discu- 
timos as questões do uso de MANOVA da perspectiva 
de controle da precisão estatística e eficiência e ainda 
fornecemos o ambiente apropriado para testar questões 
multivariadas. 


Controle de taxa de erro experimental 

O uso de ANOV As univariadas separadas ou testes t pode 
criar um problema quando tentamos controlar a taxa de 
erro experimental [12]. Por exemplo, considere que ava- 
liamos uma série de cinco variáveis dependentes por meio 
de ANOVAs separadas, sempre usando 0,05 como nível 
de significância. Dada a inexistência de diferenças reais 
nas variáveis dependentes, é de se esperar a observação 
de um efeito significante sobre qualquer variável depen- 
dente dada em 5% do tempo. No entanto, em nossos cinco 
testes separados, a probabilidade de um erro Tipo 1 gira 
em torno de 5%, se todas as variáveis dependentes estão 
perfeitamente correlacionadas, e 23% (1 — 0,95”), se todas 
as variáveis dependentes são não-correlacionadas. Assim, 
uma série de testes estatísticos separados nos deixa sem 
controle de nossa taxa de erro Tipo I efetiva geral ou ex- 
perimental. Se o pesquisador deseja manter o controle so- 
bre a taxa de erro experimental e existe pelo menos algum 
grau de inter-correlação entre as variáveis dependentes, 
então MANOVA é apropriada. 


Diferenças em uma combinação 

de variáveis dependentes 

Uma série de testes ANOVA univariados também ignora 
a possibilidade de que alguma composição (combinação 
linear) das variáveis dependentes possa fornecer evidên- 
cia de uma diferença geral de grupo que possa passar 
despercebida ao examinar-se cada variável dependente 
separadamente. Os testes individuais ignoram as corre- 
lações entre as variáveis dependentes, e, na presença de 
multicolinearidade entre as variáveis dependentes, MA- 
NOVA será mais poderosa do que os testes univariados 
individuais de diversas maneiras: 


e MANOVA pode detectar diferenças combinadas não en- 
contradas nos testes univariados. 


CAPÍTULO 6 Análise Multivariada de Variância 315 


Estágio 1 
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Univariado múltiplo 
Multivariado estrutural 
Intrinsecamente multivariado 
Seleção de variáveis dependentes 
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Questões do planejamento de pesquisa 
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FIGURA 6-3 Estágios 1-3 no diagrama de decisão da análise multivariada de variância (MANOVA). 


e Se múltiplas variáveis estatísticas são formadas, então elas 
podem fornecer dimensões de diferenças que podem distin- 
guir entre os grupos melhor do que variáveis isoladas. 

e Se o número de variáveis dependentes for mantido relati- 
vamente baixo (5 ou menos), o poder estatístico dos testes 
de MANOVA se iguala ou excede aquele obtido com uma 
única ANOVA [4]. 


As considerações que envolvem tamanho de amostra, 
número de variáveis dependentes e poder estatístico são 
apresentadas em uma seção subsequente. 


Tipos de questões multivariadas 
apropriadas a MANOVA 


As vantagens de MANOVA versus uma série de ANO- 
VAs univariadas vão além do domínio estatístico discutido 
anteriormente e também são encontradas em sua habili- 


dade de fornecer um único método para testar diversas 
questões multivariadas. No texto, enfatizamos a natureza 
de interdependência da análise multivariada. MANOVA 
tem a flexibilidade de permitir ao pesquisador a seleção 
de estatísticas de testes mais adequadas à questão de inte- 
resse. Hand e Taylor [10] classificaram os problemas mul- 
tivariados em três categorias, das quais cada uma emprega 
diferentes aspectos de MANOVA em sua resolução. Essas 
três categorias são questões univariadas múltiplas, multi- 
variadas estruturadas e intrinsecamente multivariadas. 


Questões univariadas múltiplas 

Um pesquisador que estuda múltiplas questões univaria- 
das identifica diversas variáveis dependentes separadas 
(p.ex., idade, renda, nível de formação de consumidores 
ou clientes) que devem ser analisadas separadamente, 
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mas precisam de certo controle sobre a taxa de erro expe- 
rimental. Nesse caso, MANOVA é usada para avaliar se 
uma diferença geral é encontrada entre grupos, e então os 
testes univariados separados são executados para abordar 
as questões individuais para cada variável dependente. 


Questões multivariadas estruturadas 

Um pesquisador que lida com questões multivariadas es- 
truturadas reúne duas ou mais medidas dependentes que 
tenham relações específicas entre si. Uma situação comum 
nessa categoria é a de medidas repetidas, nas quais são 
reunidas múltiplas respostas de cada sujeito, talvez com 
o passar do tempo ou em uma exposição pré/pós-teste a 
algum estímulo, como um anúncio. Aqui, MANOVA for- 
nece um método estruturado para especificar as compara- 
ções de diferenças de grupos em um conjunto de medidas 
dependentes enquanto mantém a eficiência estatística. 


Questões intrinsecamente multivariadas 

Uma questão intrinsecamente multivariada envolve um 
conjunto de medidas multivariadas no qual a principal 
preocupação é o modo como elas diferem como um todo 
nos grupos. As diferenças de medidas dependentes indi- 
viduais são menos importantes do que seu efeito coletivo. 
Um exemplo é o teste das múltiplas medidas de resposta 
que devem ser consistentes, como atitudes, preferência e 
intenção de compra, todas relacionadas com diferentes 
campanhas publicitárias. Todo o poder de MANOVA é 
utilizado nesse caso, avaliando-se não somente as diferen- 
ças gerais, mas também as diferenças entre combinações 
de medidas dependentes que, caso contrário, não seriam 
visíveis. Esse tipo de questionamento é bem abordado 
pela habilidade de MANOVA de detectar diferenças 
multivariadas, mesmo quando nenhum teste univariado 
mostra diferenças. 


Seleção das medidas dependentes 


Ao identificar as questões adequadas a MANOVA, é im- 
portante também discutir brevemente o desenvolvimen- 
to da questão de pesquisa, especificamente a seleção das 
medidas dependentes. Um problema comum encontrado 
em MANOVA é a tendência dos pesquisadores a usar de 
maneira imprópria uma de suas vantagens — a habilidade 
de lidar com múltiplas medidas dependentes — incluindo 
variáveis sem uma base conceitual ou teórica válida. O 
problema ocorre quando os resultados indicam que um 
subconjunto das variáveis dependentes pode influenciar 
as diferenças gerais entre grupos. Se algumas das medidas 
dependentes com as grandes diferenças não são realmente 
apropriadas à questão de pesquisa, diferenças “falsas” po- 
dem conduzir o pesquisador a conclusões erradas sobre 
o conjunto como um todo. Assim, o pesquisador sempre 
deve examinar cuidadosamente as medidas dependentes 
e assegurar-se de que existe uma sólida argumentação 
para incluí-las. Qualquer ordenação das variáveis, como 


possíveis efeitos sequenciais, também deve ser observada. 
MANOVA fornece um teste especial, a análise stepdo- 
wn, para avaliar as diferenças estatísticas de uma maneira 
sequencial, muito parecido com a adição de variáveis em 
uma análise de regressão. 

Em resumo, o pesquisador deve avaliar todos os aspec- 
tos da questão de pesquisa cuidadosamente e garantir que 
MANOVA seja aplicada da maneira correta e mais pode- 
rosa. As seções a seguir abordam muitas questões que têm 
um impacto sobre a validade e precisão de MANOVA; no 
entanto, em última instância, é responsabilidade do pes- 
quisador o emprego da técnica de maneira adequada. 


ESTÁGIO 2: QUESTÕES NO PROJETO 
DE PESQUISA DE MANOVA 


MANOVA segue todos os princípios básicos de planeja- 
mento de ANOVA, ainda que em alguns casos a natureza 
multivariada das medidas dependentes exija uma perspec- 
tiva única. Na seção a seguir, examinamos os princípios 
básicos de planejamento e ilustramos os aspectos ímpares 
de uma análise MANOVA. 


Exigências no tamanho da 
amostra — geral e por grupo 


MANOVA, como todas as demais técnicas multivariadas, 
pode ser sensivelmente afetada pelo tamanho da amostra 
usada. A principal diferença em MANOVA (e as outras 
técnicas que avaliam diferenças de grupos, como o teste £ 
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Processos de decisão para MANOVA 


e MANOVA é uma extensão de ANOVA que examina 
o efeito de uma ou mais variáveis independentes não- 
métricas sobre duas ou mais variáveis dependentes 
métricas 
Além da habilidade de analisar múltiplas variáveis 
dependentes, MANOVA apresenta também as 
vantagens de: 
e Controlar a taxa de erro experimental quando algum 


grau de inter-correlação entre variáveis dependentes 
está presente 

Fornecer maior poder estatístico do que ANOVA 
quando o número de variáveis dependentes é 5 ou 


menos 
Variáveis independentes não-métricas criam 
grupos entre os quais as variáveis dependentes são 
comparadas; muitas vezes os grupos representam 
variáveis experimentais ou "efeitos de tratamento" 
Pesquisadores devem incluir somente variáveis 
dependentes que têm forte suporte teórico 
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e ANOVA) é que as demandas de tamanho amostral se 
relacionam com tamanhos de grupos individuais e não 
com o tamanho da amostra total em si. Diversas questões 
básicas surgem referentes a tamanhos amostrais necessá- 
riosem MANOVA: 


e Nomínimo, a amostra em cada célula (grupo) deve ser maior 
do que o número de variáveis dependentes. Apesar de essa 
preocupação não parecer muito importante, a inclusão de 
apenas um pequeno número de variáveis dependentes (de 
5 a 10) na análise impõe uma restrição um tanto problemá- 
tica à coleta de dados. Isso é um problema particularmente 
frequente na experimentação ou pesquisa de campo, onde o 
pesquisador tem menor controle sobre a amostra obtida. 

e Como diretriz prática, um tamanho mínimo recomendado 
de célula é de 20 observações. Novamente, lembre-se que 
esta quantidade é por grupo, sendo necessárias amostras 
gerais consideravelmente grandes mesmo para análises 
simples. Em nosso exemplo anterior de anúncios publicitá- 
rios, tínhamos apenas dois fatores, cada um com dois níveis, 
mas tal análise exigiria 80 observações para um trabalho 
adequado. 

e À medida que o número de variáveis dependentes aumenta, 
o tamanho amostral exigido para manter poder estatístico 
também cresce. Continuamos nossa discussão sobre tama- 
nho amostral e poder em uma seção adiante, mas, como 
exemplo, tamanhos exigidos de amostra aumentam quase 
50% quando a quantia de variáveis dependentes pula de 
duas para seis. 


Pesquisadores devem procurar amostras de tamanhos 
iguais ou aproximadamente iguais por grupo. Apesar de 
programas de computador facilmente acomodarem gru- 
pos de tamanhos desiguais, o objetivo é garantir que um 
tamanho adequado de amostra esteja disponível para to- 
dos os grupos. Na maioria dos casos, a efetividade da aná- 
lise é ditada pelos grupos de menor tamanho, tornando 
assim a preocupação com este assunto algo prioritário. 


Delineamentos fatoriais — dois 
ou mais tratamentos 


Muitas vezes, o pesquisador deseja examinar os efeitos de 
diversas variáveis independentes ou tratamentos em vez 
de usar apenas um único tratamento em testes ANOVA 
ou MANOVA. Essa capacidade é uma distinção funda- 
mental entre MANOVA e análise discriminante no sen- 
tido de ser capaz de determinar o impacto de múltiplas 
variáveis independentes na formação de grupos com dife- 
renças significantes. Uma análise com dois ou mais trata- 
mentos (fatores) é chamada de planejamento fatorial. Em 
geral, um planejamento com n tratamentos é chamado de 
planejamento fatorial com n fatores. 


Seleção de tratamentos 

O uso mais comum de planejamentos fatoriais envolve as 
questões de pesquisa que relacionam duas ou mais variá- 
veis independentes não-métricas a um conjunto de variá- 


veis dependentes. Nesses casos, as variáveis independen- 
tes são especificadas no delineamento do experimento ou 
incluídas no delineamento do campo da experimentação 
ou no questionário da pesquisa. 


Tipos de tratamentos. Como discutido ao longo do capí- 
tulo, um tratamento ou fator é uma variável independente 
não-métrica com um número definido de níveis (catego- 
rias). Cada nível representa uma diferente condição ou 
característica que afeta a(s) variável(i)s dependente(s). 
Em um experimento, esses tratamentos e níveis são pla- 
nejados pelo pesquisador e administrados no curso do 
experimento. Em pesquisa de campo, eles são caracterís- 
ticas dos respondentes reunidas pelo pesquisador e então 
incluídas na análise. 

Mas, em alguns casos, tratamentos são necessários em 
acréscimo àqueles na análise original planejada. O uso 
mais comum de tratamentos adicionais é para controlar 
uma característica que afeta as variáveis dependentes mas 
não é parte do planejamento de estudo. Em tais casos, o 
pesquisador está ciente de condições (p.ex., método de co- 
leta de dados) ou características dos respondentes (p.ex., 
localização geográfica, sexo etc.) que potencialmente 
criam diferenças nas medidas dependentes. Ainda que 
eles não sejam variáveis independentes de interesse para 
o estudo, negligenciá-los é como ignorar fontes potenciais 
de diferenças que, não explicadas, podem obscurecer al- 
guns resultados de interesse. 

A maneira mais direta de explicar tais efeitos é atra- 
vés de um fator de blocagem, o qual é uma característica 
não-métrica empregada post hoc para segmentar os res- 
pondentes. A meta é agrupar os respondentes para obter 
maior homogeneidade interna nos grupos e reduzir a fon- 
te de variância MS, Fazendo isso, a habilidade dos testes 
estatísticos de identificar diferenças é aumentada. 


Considere que em nosso exemplo anterior de anúncio 
tivéssemos descoberto que os homens em geral reagiram 
de maneira diferente das mulheres. Se o sexo é usado 
como um fator de blocagem, podemos avaliar os efeitos 
das variáveis independentes separadamente para ho- 
mens e mulheres. Espera-se que essa abordagem torne 
os efeitos mais visíveis do que se assumirmos que ambos 
reagem analogamente sem que se faça uma distinção por 
sexo. Os efeitos de tipo de mensagem e perfil do cliente 
podem agora ser avaliados para homens e mulheres se- 
paradamente, fornecendo um teste mais preciso de seus 
efeitos individuais. 


Assim, qualquer característica não-métrica pode ser 
incorporada diretamente na análise para explicar seu im- 
pacto sobre as medidas dependentes. Porém, se as variá- 
veis que você deseja controlar forem métricas, elas podem 
ser incluídas como covariáveis, o que se discute na próxi- 
ma seção. 
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Número de tratamentos. Uma das vantagens das técni- 
cas multivariadas é o emprego de múltiplas variáveis em 
uma única análise. Para MANOVA, esta característica 
se relaciona com o número de variáveis dependentes que 
podem ser analisadas concomitantemente. Como já discu- 
tido, o número de variáveis dependentes afeta o tamanho 
amostral exigido, bem como outros aspectos. Mas e quan- 
to ao número de tratamentos (ou seja, variáveis inde- 
pendentes)? Apesar de ANOVA e MANOVA poderem 
analisar diversos tratamentos ao mesmo tempo, diversas 
considerações se relacionam ao número de tratamentos 
em uma análise. 


Número de células formadas. Talvez a questão mais 
limitante envolvendo múltiplos tratamentos seja o nú- 
mero de células (grupos) formadas. Como discutido em 
nosso exemplo anterior, o número de células é o produto 
do número de níveis para cada tratamento. Por exemplo, 
se tivéssemos dois tratamentos com dois níveis cada e um 
tratamento com quatro níveis, um total de 16 células (2 x 
2x4= 16) seria formado. Manter um tamanho suficiente 
para cada célula (assumindo 20 respondentes por célula) 
requer uma amostra total de 320. 

Quando aplicado a dados de pesquisa de campo, po- 
rém, o aumento do número de células se torna muito mais 
problemático. Como em pesquisa de campo geralmente 
não se é capaz de administrar individualmente o estudo 
para cada célula do planejamento, o pesquisador deve ad- 
mitir uma amostra geral suficientemente grande para pre- 
encher cada célula de acordo com o mínimo exigido. As 
proporções da amostra total em cada célula possivelmen- 
te variam bastante (ou seja, algumas células são mais pro- 
váveis de ocorrer do que outras), especialmente quando o 
número de células aumenta. Em tal situação, o pesquisa- 
dor deve planejar um tamanho amostral ainda maior do 
que aquele determinado quando se multiplica o número 
de células pelo mínimo por célula. Retornemos ao nosso 
exemplo anterior para ilustrar este problema. 


Considere que temos um planejamento simples de dois 
fatores com dois níveis para cada um (2 x 2). Se esse pla- 
nejamento de quatro células fosse um experimento con- 
trolado, o pesquisador seria capaz de designar aleato- 
riamente 20 respondentes por célula para uma amostra 
geral de 80. E se for uma pesquisa de campo? Se fosse 
igualmente provável que respondentes se encaixassem 
em cada célula, então o pesquisador poderia obter uma 
amostra total de 80 e cada célula deveria ter uma amos- 
tra de 20. Proporções e amostras tão organizadas rara- 
mente acontecem. E se uma célula representasse apenas 
10% da população? Se usarmos uma amostra total de 80, 
tal célula deveria ter uma amostra de apenas 8. Logo, se 
o pesquisador quisesse uma amostra de 20 mesmo para 
esta pequena célula, a amostra geral deveria ser aumen- 
tada para 200. 


A menos que sofisticados planos de amostragem se- 
jam usados para garantir o tamanho necessário por célula, 
aumentar o número delas (e assim a possibilidade de pro- 
porções populacionais diferentes) demanda um tamanho 
amostral ainda maior do que em um experimento contro- 
lado. Falhar nisso criaria situações nas quais as proprie- 
dades estatísticas da análise poderiam ficar seriamente 
comprometidas. 


Criação de efeitos de interação. Sempre que mais 
de um tratamento é usado, efeitos de interação são cria- 
dos. O termo de interação representa o efeito conjunto 
de dois ou mais tratamentos. Em termos simples, significa 
que a diferença entre grupos de um tratamento depende 
dos valores de outro. Examinemos um exemplo simples: 


Considere que temos dois tratamentos — região (leste ver- 
sus oeste) e tipo de cliente (clientes e não-clientes). Pri- 
meiro, considere que na variável dependente (atitude em 
relação à HBAT) clientes marquem 15 pontos a mais do 
que não-clientes. No entanto, uma interação de região e 
tipo de cliente indicaria que a diferença entre cliente e 
não-cliente depende da região dos mesmos. Por exemplo, 
quando separamos as duas regiões, podemos ver que clien- 
tes do leste marcaram 25 pontos a mais do que não-clientes 
na mesma região, enquanto no oeste a diferença é de ape- 
nas 5 pontos. Em ambos os casos, os clientes pontuaram 
mais, mas a dimensão da diferença depende da região. 
Este resultado é uma interação dos dois tratamentos. 


Termos de interação são criados para cada combinação 
de variáveis de tratamento. Interações de dois fatores são 
variáveis consideradas duas por vez. Interações de três fa- 
tores são combinações de três variáveis, e assim por diante. 
O número de tratamentos determina a quantia possível de 
termos de interação. A tabela a seguir mostra as interações 
criadas para duas, três e quatro variáveis independentes: 


Termos de interação 

Tratamentos Duas Três Quatro 
A,B AxB 
A,B,C AxB AxBxC 

AxC 

BxC 
A,B,C,D AxB AxBxC AxBxCxD 

AxC 

AxD AxBxD 

BxC 

BxD BxCxD 

CxD 

AxCxD 


Discutimos os vários tipos de termos de interação e as 
interpretações correspondentes na próxima seção, mas o 
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pesquisador deve estar pronto para interpretar e explicar 
os mesmos, sejam significantes ou não, dependendo da 
questão de pesquisa. 

Obviamente, as considerações sobre tamanho amostral 
são da maior importância, mas o pesquisador não deve se 
descuidar das implicações dos termos de interação. Além 
de usar pelo menos um grau de liberdade para cada inte- 
ração, eles apresentam questões de interpretação discuti- 
das no estágio 4. 


Uso de covariáveis - ANCOVA e MANCOVA 


Discutimos anteriormente o uso de fator de blocagem para 
controlar influências sobre a variável dependente que não 
são parte do planejamento de pesquisa mas precisam ser 
explicadas na análise. Ele permite ao pesquisador contro- 
le sobre variáveis não-métricas, mas e quanto às variáveis 
métricas? Um método é converter a variável métrica em 
uma não-métrica (p.ex., partição pela mediana etc.), mas 
este processo geralmente é considerado inadequado, pois 
muita informação contida na variável métrica é perdida 
na conversão. Uma segunda abordagem é a inclusão das 
variáveis métricas como covariáveis. 

Essas variáveis podem extrair influências estranhas da 
variável dependente, aumentando assim a variância den- 
tro do grupo (MSy,). O processo segue dois passos: 


1. Procedimentos semelhantes à regressão linear são emprega- 
dos para remover variação na variável dependente associa- 
da com uma ou mais covariáveis. 

2. Uma análise convencional é conduzida sobre a variável 
dependente ajustada. De modo simples, ela se torna uma 
análise dos resíduos de regressão uma vez que os efeitos das 
covariáveis são removidos. 


Quando usada com ANOVA, a análise se chama análise 
de covariância (ANCOVA) e a extensão simples dos princí- 
pios de ANCOVA para a análise de multivariada (múltiplas 
variáveis dependentes) é conhecida como MANCOVA. 


Objetivos de análise de covariância 

O objetivo da covariável é eliminar quaisquer efeitos que 
(1) afetem apenas uma parte dos respondentes ou (2) va- 
riem entre os respondentes. Semelhantes ao uso de um 
fator de blocagem, covariáveis podem atingir dois propó- 
sitos específicos: 


1. Eliminar algum erro sistemático fora do controle do pesqui- 
sador e que possa viesar os resultados 

2. Explicar diferenças nas respostas devido a características 
típicas dos respondentes 


Em ambientes experimentais, a maioria dos vieses sis- 
temáticos pode ser eliminada pela associação aleatória 
de respondentes a vários tratamentos. Não obstante, em 
pesquisa não-experimental, tais controles não são viáveis. 
Por exemplo, no teste de um anúncio publicitário, efeitos 
podem diferir, dependendo da hora do dia ou do tipo de 
audiência e de suas reações. Além disso, diferenças pes- 


soais como atitudes ou opiniões podem afetar respostas, 
mas a análise não inclui as mesmas como um fator de tra- 
tamento. O pesquisador usa uma covariável para eliminar 
quaisquer diferenças devido a tais fatores antes que os 
efeitos do experimento sejam calculados. 


Seleção de covariáveis 

Uma covariável efetiva é aquela que é altamente correla- 
cionada com a variável dependente, mas não-correlaciona- 
da com as variáveis independentes. Examinemos o porquê. 
A variância na variável dependente forma a base de nosso 
termo de erro. 


e Sea covariável é correlacionada com a variável dependen- 
te e não com as variáveis independentes, podemos explicar 
uma parte da variância com a covariável (por meio de re- 
gressão linear), restando uma variância residual (não expli- 
cada) menor na variável dependente. Essa variância residu- 
al fornece um termo de erro menor (MS) para a estatística 
Fe, assim, um teste mais eficiente de efeitos de tratamento. 
De qualquer modo, a quantia explicada pela covariável não- 
correlacionada não teria sido explicada pela variável inde- 
pendente (pois a covariável não está correlacionada com a 
mesma). Logo, o teste das variáveis independentes é mais 
sensível e poderoso. 

e No entanto, se a covariável está correlacionada com a(s) 
variável(eis) independente(s), então a covariável explica 
parte da variância que poderia ter sido explicada pela variá- 
vel independente e reduz seus efeitos. Como a covariável é 
extraída primeiro, qualquer variação associada com ela não 
está disponível para as variáveis independentes. 


Assim, é crítico que o pesquisador garanta que a cor- 
relação das covariáveis e variáveis independentes seja pe- 
quena o suficiente, de forma que a diminuição no poder 
explanatório a partir da redução da variância que poderia 
ter sido explicada pelas variáveis independentes seja me- 
nor do que a queda na variância não explicada atribuível 
às covariáveis. 


Número de covariáveis. Uma questão comum envolve a 
quantidade de covariáveis a serem acrescentadas na aná- 
lise. Apesar de o pesquisador querer explicar o máximo 
possível de efeitos estranhos, um número muito grande 
reduz a eficiência estatística dos procedimentos. Uma re- 
gra prática [13] é que o número máximo de covariáveis se 
determina da seguinte maneira: 


Número máximo de covariáveis = (0,10 x Tamanho da 
amostra) — (Número de grupos — 1). 


Por exemplo, para uma amostra de 100 respondentes e 5 
grupos, o número de covariáveis deve ser menor do que 
6 [6 = 0,10 x 100 — (5 — 1)]. No entanto, para apenas dois 
grupos, a análise poderia incluir até 9 covariáveis. 


O pesquisador sempre deve tentar minimizar o número 
de covariáveis, ao mesmo tempo em que garante que cova- 
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riáveis efetivas não sejam eliminadas, pois em muitos ca- 
sos, particularmente com amostras pequenas, elas podem 
melhorar muito a sensibilidade dos testes estatísticos. 


Suposições para análise de covariância. Há duas exigên- 
cias para o uso de uma análise de covariância: 


1. As covariáveis devem ter alguma relação (correlação) com 
as medidas dependentes 

2. As covariáveis devem ter uma homogeneidade de efeito de 
regressão, o que significa que a(s) covariável(eis) têm efei- 
tos iguais sobre a variável dependente ao longo dos grupos. 
Em termos de regressão, isso implica coeficientes iguais 
para todos os grupos. 


Há testes estatísticos disponíveis para avaliar se essa 
suposição é verdadeira para cada covariável empregada. 
Se alguma dessas exigências não for atendida, o uso de 
covariáveis será inadequado. 


Contrapartes MANOVA de outros 
delineamentos ANOVA 


Existem muitos tipos de planejamentos ANOVA que são 
discutidos em textos padrão sobre planejamento expe- 
rimental [15, 19, 22]. Todo planejamento ANOVA tem 
sua contraparte multivariada; ou seja, qualquer ANOVA 
sobre uma variável dependente pode ser estendida para 
planejamentos MANOVA. Para ilustrar este fato, terí- 
amos que discutir cada processo ANOVA em detalhes. 
Naturalmente, este tipo de discussão não é possível em 
um único capítulo, pois livros inteiros são dedicados a 
planejamentos ANOVA. Para mais informações, o leitor 
pode consultar textos de caráter mais estatístico [1,2,5, 7, 
8,9, 11,20, 25]. 


Um caso especial de MANOVA: 
medidas repetidas 


Discutimos várias situações nas quais queremos examinar 
diferenças sobre diversas medidas dependentes. Uma si- 
tuação especial desse tipo ocorre quando o mesmo res- 
pondente fornece diversas medidas, como escores de teste 
ao longo do tempo, e desejamos examiná-las para ver se 
surge qualquer tendência. No entanto, sem tratamento 
especial, estaríamos violando a suposição mais importan- 
te, a independência. Há modelos MANOVA especiais, 
chamados de medidas repetidas, que podem explicar essa 
dependência e ainda verificar se quaisquer diferenças 
ocorreram em indivíduos no conjunto de variáveis depen- 
dentes. A perspectiva pessoal é importante, de forma que 
cada pessoa é colocada em uma mesma situação.* 


Por exemplo, considere que estejamos avaliando melho- 
ramentos sobre escores de teste no semestre. Devemos 


*N. de R. T.: A idéia é que cada pessoa possa ter as suas próprias 
medidas comparadas entre si. 


explicar os escores de teste anteriores e o modo como 
eles se relacionam com os escores posteriores, e pode- 
mos esperar ver diferentes tendências para aqueles com 
escores iniciais baixos versus altos. Assim, devemos “ca- 
sar” os escores de cada respondente quando fazemos a 
análise. As diferenças nas quais estamos interessados são 
o quanto cada pessoa muda, e não necessariamente as 
mudanças em médias de grupos ao longo do semestre. 


Não abordamos os detalhes de modelos de medidas re- 
petidas neste texto porque é uma forma especializada de 
MANOVA. O leitor interessado pode encontrar muitos 
textos bons sobre o assunto [1,2,5,7,8,9,11,20,25]. 


ESTÁGIO 3: SUPOSIÇÕES DE 
ANOVA E MANOVA 


Os procedimentos de teste univariado de ANOVA descri- 
tos neste capítulo são válidos (em um sentido estatístico) 
somente quando se assume que a variável dependente é 
normalmente distribuída, que os grupos são independen- 
tes em suas respostas sobre a variável dependente, e que 
as variâncias são iguais para todos os grupos de tratamen- 
to. Há evidências [19, 27], porém, de que os testes F em 
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Planejamento de pesquisa de MANOVA 


e Células (grupos) são formadas pela combinação de 
variáveis independentes; por exemplo, uma variável 
não-métrica de três categorias (como baixo, médio e 
alto) combinada com uma variável não-métrica de duas 
categorias (como sexo masculino e feminino) resultará 
em um planejamento 3 x 2 com seis células (grupos) 
Tamanho amostral por grupo é uma questão crítica de 
planejamento: 

e O tamanho mínimo de amostra por grupo deve ser 
maior do que o número de variáveis dependentes 
O mínimo recomendado é de 20 observações por 


célula (grupo) 
Pesquisadores deveriam tentar ter tamanhos 
amostrais aproximadamente iguais por célula 
(grupo) 
Covariáveis e variáveis de blocagem são modos efetivos 
de controle de influências externas sobre as variáveis 


dependentes que não são diretamente representadas 

nas variáveis independentes 

e Uma covariável efetiva é aquela que é altamente 
correlacionada com a(s) variável(is) dependente(s) 
mas não correlacionada com as independentes 
O número máximo de covariáveis em um modelo 
deve ser (0,10 x Tamanho amostral) — (Número de 
grupos -— 1) 
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ANOVA são robustos em relação a essas suposições, ex- 
ceto em casos extremos. 

Para os procedimentos de teste multivariado de MA- 
NOVA serem válidos, três suposições devem ser atendi- 
das: 


e As observações devem ser independentes 

e As matrizes de variância-covariância devem ser iguais para 
todos os grupos de tratamento 

e O conjunto de variáveis dependentes deve seguir uma dis- 
tribuição normal multivariada (isto é, qualquer combinação 
linear das variáveis dependentes deve seguir uma distribui- 
ção normal) [11] 


Além das suposições estatísticas estritas, o pesquisa- 
dor também deve considerar diversas questões que in- 
fluenciam os possíveis efeitos — a saber, a linearidade e 
a multicolinearidade da variável estatística de variáveis 
dependentes. 


Independência 


A mais básica, porém mais séria, violação de uma suposi- 
ção ocorre quando há uma falta de independência entre 
as observações, o que significa que as respostas em cada 
célula (grupo) não são feitas independentemente de res- 
postas em qualquer outro grupo. Violações dessa supo- 
sição podem acontecer de maneira igualmente fácil tan- 
to em situações experimentais como não-experimentais. 
Qualquer quantia de efeitos estranhos e não-medidos 
pode afetar os resultados criando dependência entre os 
grupos, mas duas das mais comuns violações de indepen- 
dência são devido a: 


e Efeitos temporalmente ordenados (correlação serial) que 
acontecem se forem tomadas medidas ao longo do tempo, 
mesmo a partir de diferentes respondentes. 

e Reunião de informação em grupos, de modo que uma expe- 
riência em comum (como uma sala barulhenta ou um con- 
junto confuso de instruções) faria com que um subconjunto 
de indivíduos (aqueles que têm a experiência em comum) 
tivesse respostas que de algum modo fossem correlaciona- 
das. 


Apesar de não existirem testes com uma certeza abso- 
luta de detectar todas as formas de dependência, o pesqui- 
sador deve explorar todos os efeitos possíveis e corrigi-los 
quando encontrados. Uma possível solução é combinar os 
que estão dentro dos grupos e analisar o escore médio de 
grupo em vez dos escores dos respondentes em separado. 
Outra abordagem é empregar um fator de blocagem ou 
alguma forma de análise de covariáveis para explicar a de- 
pendência. Em qualquer caso, ou quando se suspeita que 
haja dependência, o pesquisador deve usar um nível de 
significância mais baixo (0,01 ou até menos). 


Igualdade de matrizes de variância-covariância 


A segunda suposição de MANOVA é a equivalência de 
matrizes de covariância nos grupos. Aqui estamos preocu- 


pados com diferenças substanciais no montante de variân- 
cia de um grupo versus outro grupo para as variáveis de- 
pendentes (como no problema de heteroscedasticidade em 
regressão múltipla). Em MANOVA, com múltiplas variá- 
veis dependentes, o interesse é nas matrizes de variância- 
covariância das medidas dependentes para cada grupo. 

A exigência de equivalência é um teste estrito, porque 
em vez de variâncias iguais para uma única variável em 
ANOVA, o teste MANOVA examina todos os elemen- 
tos da matriz de covariância das variáveis dependentes. 
Por exemplo, para cinco variáveis dependentes, as cin- 
co correlações e dez covariâncias são todas testadas em 
termos de igualdade nos grupos. Programas MANOVA 
conduzem o teste para igualdade de matrizes de covariân- 
cia — tipicamente o teste M de Box — e fornecem níveis 
de significância para a estatística do teste. O teste M de 
Box é particularmente sensível a desvios da normalidade 
[11, 23]. Logo, sempre deve ser verificada a normalidade 
univariada de todas as medidas dependentes antes de se 
executar tal teste. 

Felizmente, uma violação dessa suposição tem impac- 
to mínimo se os grupos têm aproximadamente o mesmo 
tamanho (ou seja, se o tamanho do maior grupo dividi- 
do pelo tamanho do menor for menos do que 1,5). Se os 
tamanhos diferem mais do que isso, então o pesquisador 
tem diversas opções: 


e Primeiro, aplicar uma das muitas transformações de esta- 
bilização de variância disponíveis (ver Capítulo 2 para uma 
discussão sobre esses métodos) e testar novamente para ver 
se o problema foi solucionado. 

e Se as variâncias diferentes persistirem após a transformação 
e os tamanhos dos grupos diferirem bastante, o pesquisa- 
dor deverá fazer ajustes para seus efeitos. Primeiro, deve-se 
verificar qual grupo tem a maior variância. Essa determina- 
ção é facilmente feita examinando-se a matriz de variância- 
covariância ou usando-se o determinante da matriz de va- 
riância-covariância, que é fornecida por todos os programas 
estatísticos. Em seguida: 

e Se as maiores variâncias são encontradas nos maiores 
grupos, o nível alfa fica exagerado, o que significa que as 
diferenças deveriam na verdade ser avaliadas usando um 
valor um pouco menor (por exemplo, usar 0,03 no lugar 
de 0,05). 

e Se a variância maior é encontrada nos grupos menores, 
então o inverso é verdadeiro. O poder do teste foi redu- 
zido e o pesquisador deve aumentar o nível de signifi- 
cância. 


A habilidade de amostras com tamanhos aproximada- 
mente iguais entre os grupos para suavizar violações dessa 
suposição reforça a importância do planejamento da aná- 
lise na seleção de tratamentos para a mesma e na manu- 
tenção de amostras com o mesmo tamanho. 


Normalidade 


A última suposição para MANOVA ser válida se refere à 
normalidade das medidas dependentes. No sentido estri- 
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to, a suposição é que todas as variáveis são normais mul- 
tivariadas. Uma distribuição normal multivariada consi- 
dera que o efeito conjunto de duas variáveis é distribuído 
normalmente. Ainda que essa suposição seja inerente à 
maioria das técnicas multivariadas, não existe teste direto 
para normalidade multivariada. Logo, a maioria dos pes- 
quisadores testa a normalidade univariada de cada variá- 
vel. Apesar de a normalidade univariada não garantir a 
normalidade multivariada, se todas as variáveis atendem 
essa condição, então quaisquer desvios da normalidade 
multivariada geralmente são inócuos. 

Violações dessa suposição têm pouco impacto em 
amostras maiores, assim como ocorre em ANOVA. Violar 
essa suposição inicialmente cria problemas na aplicação 
do teste M de Box, mas transformações podem corrigir 
tais problemas na maioria das situações. Para uma discus- 
são sobre as transformações de variáveis, ver o Capítulo 2. 
Com amostras de tamanho moderado, violações modestas 
podem ser acomodadas desde que as diferenças sejam de- 
correntes de assimetrias e não de observações atípicas. 


Linearidade e multicolinearidade 
entre as variáveis dependentes 


Apesar de MANOVA avaliar as diferenças ao longo de 
combinações de medidas dependentes, ela pode construir 
uma relação linear apenas entre as medidas dependentes 
(e quaisquer covariáveis, se incluídas). O pesquisador é 
novamente encorajado a primeiramente examinar os da- 
dos, dessa vez avaliando a presença de relações não-line- 
ares. Se elas existirem, então poderá ser tomada a deci- 
são quanto a necessidade de elas serem incorporadas ao 
conjunto de variáveis dependentes, ao preço de crescente 
complexidade, mas maior representatividade. O Capítulo 
2 aborda tais testes. 


REGRAS PRÁTICAS 6-3 


Suposições MANOVA/ANOVA 


Para que os procedimentos de teste multivariado 
usados com MANOVA sejam válidos: 
Observações devem ser independentes 
Matrizes de variância-covariância devem ser 
iguais (ou comparáveis) para todos os grupos de 
tratamento 
As variáveis dependentes devem ter uma 


distribuição normal multivariada 

Normalidade multivariada é assumida, mas muitas 
vezes difícil de avaliar; normalidade univariada não 
garante a multivariada, mas se todas as variáveis 
atendem à exigência em sua versão univariada, 
então desvios da normalidade multivariada são 


inconsegiientes. 
Testes F de ANOVA são geralmente robustos se 
violações dessas suposições são modestas 


Além da condição de linearidade, as variáveis depen- 
dentes não devem ter multicolinearidade elevada (discu- 
tida no Capítulo 4), o que indica medidas dependentes 
redundantes e diminui a eficiência estatística. Discutimos 
o impacto da multicolinearidade sobre o poder estatístico 
de MANOVA na próxima seção. 


Sensibilidade a observações atípicas 


Além do impacto de heteroscedasticidade discutido an- 
teriormente, MANOVA (e ANOVA) é especialmente 
sensível a observações atípicas e seu impacto sobre o erro 
Tipo I. O pesquisador é fortemente encorajado a primei- 
ramente examinar os dados em busca de observações atí- 
picas e eliminá-las da análise, se possível, pois seu impacto 
sobre os resultados gerais será desproporcional. 


ESTÁGIO 4: ESTIMAÇÃO DO |. 
MODELO MANOVA E AVALIAÇÃO 
DO AJUSTE GERAL 


Uma vez que a análise MANOVA tenha sido formula- 
da e as suposições tenham sido testadas do modo como 
se exige, a avaliação de diferenças significantes entre os 
grupos formados pelo(s) tratamento(s) pode prosseguir 
(ver Figura 6-4). Procedimentos de estimação baseados 
no modelo linear geral estão se tornando mais comuns, e 
as questões básicas serão abordadas. Com o modelo esti- 
mado, o pesquisador pode então avaliar as diferenças em 
médias com base nas estatísticas de teste mais apropriadas 
aos objetivos de estudo. Além disso, em qualquer situa- 
ção, mas especialmente quando a análise se torna mais 
complexa, o pesquisador deve avaliar o poder dos testes 
estatísticos para fornecer a perspectiva mais bem informa- 
da sobre os resultados obtidos. 


Estimação com o modelo linear geral 


A maneira tradicional de calcular as estatísticas de teste 
apropriadas para ANOVA e MANOVA foi estabelecida 
há mais de 70 anos [26]. Nos últimos anos, porém, o mo- 
delo linear geral (GLM) [18, 21] tornou-se um modo po- 
pular de estimação de modelos ANOVA e MANOVA. O 
procedimento GLM, como o nome sugere, é uma família 
de modelos, cada um composto de três elementos: 


e Variável estatística. A combinação linear de variáveis inde- 
pendentes como especificada pelo pesquisador. Cada variá- 
vel independente tem um peso estimado representando a 
contribuição da mesma ao valor previsto. 

e Componente aleatória. A distribuição de probabilidade con- 
siderada para as variáveis dependentes. Distribuições típi- 
cas de probabilidades são a normal, de Poisson, binomial e 
multinomial. Cada distribuição é associada com um tipo de 
variável resposta (p.ex., variáveis contínuas são associadas 
com uma distribuição normal, proporções são associadas 
com a distribuição binomial, e variáveis dicotômicas corres- 
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Do 
estágio 
3 


Estágio 4 


Estimar a significância de diferenças de grupos 


Selecionar critérios para testes de significância 
Avaliar o poder estatístico 
Aumentar o poder 
Uso em planejamento e análise 
Efeitos de multicolinearidade de variáveis dependentes 


Estágio 5 


Interpretar os efeitos de variáveis 


Avaliar covariáveis 

Avaliar o impacto de variáveis independentes 
Testes post hoc versus a priori 
Análise stepdown 


Identificar as diferenças entre grupos 


Métodos post hoc 
Métodos a priori ou de comparação planejada 


Estágio 6 


Validar os resultados 


Repetição 


Análise de amostras particionadas 


FIGURA 6-4 Estágios 4-6 no diagrama de decisão da análise multivariada de variância (MANOVA). 


pondem à distribuição de Poisson). O pesquisador escolhe 
a componente aleatória com base no tipo de variável res- 
posta. 

e Função de ligação. Fornece a conexão teórica entre a va- 
riável estatística e a componente aleatória para acomodar 
diferentes formulações de modelos. A função de ligação es- 
pecifica o tipo de transformação necessário para designar o 
modelo desejado. Os três tipos mais comuns de funções de 
ligação são a identidade, logit e logaritmo. 


O método GLM dá ao pesquisador um modelo de es- 
timação dentro do qual qualquer quantia de modelos es- 
tatísticos distintos pode ser acomodada. Duas vantagens 
únicas do método GLM são a sua flexibilidade e simplici- 
dade no delineamento de modelos. 


e Pela determinação de uma combinação específica da com- 
ponente aleatória e da função de ligação acopladas com um 
tipo de variável na variável estatística, uma vasta gama de 
modelos multivariados pode ser estimada. Como se mostra 
na Tabela 6-2, combinações dessas componentes correspon- 


dem a muitas das técnicas multivariadas já discutidas. As- 
sim, um procedimento de estimação único pode ser usado 
para muitos modelos empíricos. 

O pesquisador pode também mudar a função de ligação ou 
a distribuição de probabilidades para melhor combinar as 
propriedades reais dos dados em vez de empregar exten- 
sivas transformações dos mesmos. Dois exemplos ilustram 
este ponto. Primeiro, em casos de heteroscedasticidade, a 
substituição da distribuição gama permitiria a estimação do 
modelo sem transformar a medida dependente. Segundo, se 
a variável estatística fosse considerada multiplicativa e não 
aditiva, uma alternativa seria o emprego de uma transfor- 
mação logarítmica da variável estatística. Em um GLM, a 
variável estatística pode permanecer na formulação aditiva 
com uma função logarítmica de ligação sendo empregada. 


Uma discussão mais aprofundada do procedimento 


GLM e suas inúmeras variações está disponível em diver- 
sos textos [6, 14, 18]. Aqui, oferecemos esta breve introdu- 
ção ao conceito de GLM por ele ter se tornado o método 
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TABELA 6-2 Especificação de modelos multivariados como componentes GLM 


Variável resposta Variável Distribuição de 
Técnica multivariada (dependente) independente Função de ligação probabilidade 
Regressão múltipla Métrica Métrica Identidade Normal 
Regressão logística Não-métrica Métrica Logit Binomial 
ANOVA/MANOVA Métrica Não-métrica Identidade Normal 


preferido de estimação para ANOVA e MANOVA entre 
muitos pesquisadores e entre alguns programas estatísti- 
cos (p.ex., SPSS). 


Critérios para teste de significância 


Em nossas discussões sobre a semelhança de MANO- 
VA com análise discriminante, chamamos atenção para 
a maior raiz característica e a primeira função discrimi- 
nante, e tais termos implicam que múltiplas funções dis- 
criminantes podem atuar como variáveis estatísticas das 
variáveis dependentes. O número de funções é defini- 
do pelo menor entre (k — 1) e p, onde k é o número de 
grupos e p é a quantia de variáveis dependentes. Assim, 
qualquer medida para testar a significância estatística de 
diferenças de grupos em MANOVA pode demandar que 
se considerem diferenças ao longo de múltiplas funções 
discriminantes. 


Medidas estatísticas 

Como vimos primeiramente em análise discriminante 
(Capítulo 5), pesquisadores usam vários critérios estatís- 
ticos para avaliar as diferenças ao longo de dimensões das 
variáveis dependentes. As medidas mais usadas são: 


e A maior raiz característica de Roy (ger), como o nome su- 
gere, mede as diferenças apenas quanto à primeira função 
discriminante entre as variáveis dependentes. Esse critério 
fornece vantagens em poder e especificidade do teste, mas 
o torna menos útil em situações em que todas as dimensões 
devem ser consideradas. O teste ger de Roy é mais ade- 
quado quando as variáveis dependentes estão fortemente 
inter-relacionadas em uma única dimensão, mas também 
é a medida mais facilmente afetada por violações das su- 
posições. 

e O lambda de Wilks (também conhecido como a estatística 
U) é muitas vezes chamado de Fmultivariado e é comumen- 
te usado para testar significância geral entre grupos em uma 
situação multivariada. Diferente da estatística ger de Roy, a 
qual é baseada na primeira função discriminante, o lambda 
de Wilks considera todas as funções discriminantes; ou seja, 
examina se os grupos são de algum modo diferentes, sem 
se preocupar com a possibilidade de eles diferirem em pelo 
menos uma combinação linear das variáveis dependentes. 
Apesar de a distribuição do lambda de Wilks ser complexa, 
há boas aproximações disponíveis para teste de significância 
que a transformam em uma estatística F [22]. 

e O critério de Pillai e o traço de Hotelling são duas outras 
medidas semelhantes ao lambda de Wilks por considerarem 
todas as raízes características e poderem ser aproximadas 
por uma estatística F. 


Com somente dois grupos, todas as medidas são equiva- 
lentes. Diferenças ocorrem à medida que o número de fun- 
ções discriminantes aumenta. A discussão a seguir identifi- 
ca as medidas mais adequadas para diferentes situações. 


Seleção de uma medida estatística 

Qual critério é preferido? A medida preferida é a que for 
mais imune a violações das suposições inerentes a MA- 
NOVA e que ainda mantiver o maior poder. Cada medida 
tem diferentes propriedades, de modo que variadas situa- 
ções favorecem medidas distintas: 


e O critério de Pillai ou o lambda de Wilks é a medida pre- 
ferida quando as considerações básicas de planejamento 
(tamanho amostral adequado, sem violações de suposições, 
células com tamanhos parecidos) são atendidas. 

e O critério de Pillai é tido como mais robusto e deve ser uti- 
lizado se o tamanho da amostra diminui, se surgem células 
com tamanhos distintos, ou se a homogeneidade de covari- 
âncias é violada. 

e O ger de Roy é um teste estatístico mais poderoso se o pes- 
quisador está seguro de que todas as suposições são estrita- 
mente atendidas e as medidas dependentes são representa- 
tivas de uma única dimensão de efeitos. 


Em uma vasta maioria de situações, todos os critérios 
estatísticos fornecem conclusões semelhantes. No entanto, 
quando se lida com conclusões conflitantes, as condições 
acima descritas podem ajudar o pesquisador na escolha 
do critério mais apropriado. Todos os critérios estão dis- 
poníveis nos principais pacotes estatísticos, o que torna as 
comparações bastante fáceis. 


Poder estatístico dos testes multivariados 


Em termos simples para MANOVA, poder é a proba- 
bilidade de que um teste estatístico identifique um efei- 
to do tratamento se ele realmente existir. O poder pode 
ser expresso também como um menos a probabilidade 
de um erro Tipo II (B) (ou seja, Poder = 1 — B). Poder 
estatístico tem um papel crucial em qualquer análise 
MANOVA, pois é usado nos processos de planejamento 
(ou seja, determinando tamanho amostral necessário) e 
como medida diagnóstica dos resultados, particularmen- 
te quando efeitos não-significantes são descobertos. As 
seções a seguir examinam primeiro os impactos sobre 
poder estatístico e então abordam questões únicas para 
utilizar análise de poder em um planejamento MANO- 
VA. O leitor é encorajado também a rever a discussão 
sobre poder no Capítulo 1. 
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Impactos sobre poder estatístico 

O nível de poder para qualquer um dos quatro critérios 
estatísticos — gcr de Roy, lambda de Wilks, traço de Ho- 
telling ou o critério de Pillai — é baseado em três consi- 
derações: o nível alfa (o), o tamanho do efeito do trata- 
mento, e o tamanho das amostras dos grupos. Cada uma 
dessas considerações é controlável em variados graus em 
um planejamento MANOVA e fornece ao pesquisador 
diversas opções para gerenciar o poder a fim de atingir o 
nível desejado de poder na faixa de 0,80 ou acima disso. 


Nível de significância estatística (alfa 0). Como discuti- 
do no Capítulo 1, poder é inversamente relacionado ao 
nível alfa (o) selecionado. Muitos pesquisadores consi- 
deram que o nível de significância é fixo em algum nível 
(p.ex., 0,05), mas na verdade ele é um julgamento do pes- 
quisador sobre onde colocar a ênfase do teste estatístico. 
Muitas vezes os outros dois elementos que afetam poder 
(tamanho do efeito e tamanho da amostra) já estão espe- 
cificados ou os dados já foram coletados, fazendo assim o 
nível alfa se tornar a ferramenta principal na definição do 
poder de uma análise. 

Estabelecendo o nível alfa necessário para denotar 
significância estatística, o pesquisador está equilibrando a 
vontade de ser estrito no que é considerada uma diferença 
significante entre grupos com a definição de um critério 
não tão alto a ponto de diferenças não-significantes não 
serem percebidas.* 


e Aumentar** alfa (isto é, o. se tornar mais conservador, como 
mudar de 0,05 para 0,01) reduz as chances de se aceitarem 
diferenças como significantes quando na realidade não o 
são. Contudo, fazer isso diminui o poder, pois ser mais sele- 
tivo quanto àquilo que é considerado como uma diferença 
estatística também aumenta a dificuldade na descoberta de 
uma diferença significante. 

e Diminuir*** o nível alfa exigido para algo ser estatisti- 
camente significante (p.ex., « mudar de 0,05 para 0,10) é 
considerado muitas vezes como sendo "menos estatísti- 
co", pois o pesquisador deseja aceitar diferenças menores 
de grupos como significantes. Não obstante, em casos nos 
quais tamanhos de efeitos ou de amostras são menores 
do que o desejado, pode ser necessário estar menos preo- 
cupado com a aceitação desses falsos positivos e dimi- 
nuir*** o nível alfa para aumentar o poder. Um exemplo 
assim ocorre quando se fazem múltiplas comparações. 
Para controlar taxa de erro experimental, o nível alfa é 
aumentado para cada comparação separada. Porém, fazer 
diversas comparações e ainda se atingir uma taxa geral de 
0,05 pode demandar níveis estritos (p.ex., 0,01 ou menos) 
para cada comparação separada, tornando assim difícil a 
tarefa de se encontrarem diferenças significantes (ou seja, 
menor poder). Aqui o pesquisador pode aumentar o nível 
alfa geral para permitir um nível alfa mais razoável para 
os testes separados. 


* N.de R.T.: A frase correta seria “... com a definição de um critério não 
tão alto a ponto de diferenças não-significantes serem percebidas”. 
** N. de R. T.: O certo é “Diminuir alfa”. 
*** N. de R. T.: O certo é “Aumentar o nível alfa”. 


O pesquisador sempre deve estar ciente das implica- 
ções do ajuste do nível alfa, pois o objetivo prioritário 
da análise não é apenas evitar erros Tipo I, mas também 
identificar os efeitos do tratamento se eles de fato existi- 
rem. Se o nível alfa é estabelecido de forma muito estrita, 
então o poder talvez seja muito pequeno para identificar 
resultados válidos. O pesquisador deve tentar manter um 
nível alfa aceitável com poder na faixa de 0,80. Para uma 
discussão mais detalhada da relação entre erros Tipo I e 
Tipo II e poder, ver Capítulo 1. 


Tamanho do efeito. Como o pesquisador aumenta o po- 
der, uma vez que um nível alfa tenha sido especificado? 
A “ferramenta” principal à sua disposição é o tamanho 
amostral dos grupos. Mas antes de avaliarmos o seu papel, 
precisamos entender o impacto do tamanho do efeito, o 
qual é uma medida padronizada de diferenças de grupos, 
normalmente expressa como as diferenças em médias de 
grupos divididas por seu desvio-padrão. Esta fórmula con- 
duz a várias generalizações: 


e Como é de se esperar, com todas as demais coisas iguais, 
tamanhos de efeitos maiores têm mais poder (ou seja, são 
mais fáceis de achar) do que tamanhos de efeitos meno- 
res. 

e A magnitude do tamanho do efeito tem um impacto direto 
sobre o poder do teste estatístico. Para qualquer tamanho 
de amostra, o poder do teste estatístico será maior quanto 
maior o tamanho do efeito. Reciprocamente, se um trata- 
mento tem um pequeno tamanho de efeito esperado, será 
necessária uma amostra muito maior para se atingir o mes- 
mo poder de um tratamento com um grande tamanho de 
efeito. 


Pesquisadores sempre esperam planejar experimen- 
tos com grandes tamanhos de efeitos. Contudo, diante de 
pesquisas de campo, pesquisadores devem “pegar o que 
conseguem” e assim devem estar cientes dos possíveis 
tamanhos de efeitos quando planejam suas pesquisas e 
quando analisam seus resultados. 


Tamanho da amostra. Com o nível alfa especificado e o 
tamanho de efeito identificado, o elemento final que afeta 
o poder é o tamanho da amostra. Em muitos casos, esse é 
o elemento sob maior controle do pesquisador. Como dis- 
cutido anteriormente, a amostra aumentada geralmente 
reduz o erro amostral e aumenta a sensibilidade (poder) 
do teste. Outros fatores discutidos anteriormente (nível 
alfa e tamanho de efeito) também afetam o poder, e po- 
demos obter algumas generalizações para planejamentos 
ANOVA e MANOVA: 


e Em análises com grupos com menos de 30 membros, obter 
níveis de poder desejados pode ser bastante problemáti- 
co. Se tamanhos de efeitos forem pequenos, o pesquisador 
pode se ver obrigado a diminuir*** o alfa (p.ex., de 0,05 
para 0,10) para obter o poder desejado. 

e Aumentar o tamanho das amostras em cada grupo tem efei- 
tos significativos até o momento em que os grupos atingem 
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aproximadamente 150, e então o aumento no poder diminui 
sensivelmente. 

e Lembre-se que grandes amostras (como 400 ou mais) redu- 
zem a componente de erro amostral a um nível tão pequeno 
que a maioria das pequenas diferenças é considerada es- 
tatisticamente significante. Quando as amostras se tornam 
grandes e a significância estatística é indicada, o pesquisa- 
dor deve examinar o poder e os tamanhos de efeito para 
garantir não apenas a significância estatística, mas também 
a significância prática. 


A habilidade de se analisarem múltiplas variáveis de- 
pendentes em MANOVA cria restrições adicionais sobre 
o poder em uma análise MANOVA. Uma fonte [17] de 
tabelas publicadas apresenta poder em várias situações 
comuns para as quais MANOVA se aplica. Porém, pode- 
mos obter algumas conclusões gerais a partir do exame de 
uma série de condições encontradas em muitos planeja- 
mentos de pesquisa. A Tabela 6-3 fornece uma visão geral 
dos tamanhos amostrais necessários para diversos níveis 
de complexidade de análise. Uma leitura da tabela con- 
duz a vários pontos de caráter geral. 


e Aumentar o número de variáveis dependentes demanda 
tamanhos maiores para amostras para que se mantenha 
um dado nível de poder. O tamanho amostral extra ne- 
cessário é mais pronunciado para tamanhos de efeitos 
menores. 

e Para pequenos tamanhos de efeitos, o pesquisador deve es- 
tar preparado para se empenhar em um substancial esfor- 
ço de pesquisa para atingir níveis aceitáveis de poder. Por 
exemplo, para conseguir o poder sugerido de 0,80 quando se 
avaliam pequenos tamanhos de efeitos em um planejamen- 
to de quatro grupos, 115 sujeitos por grupo são exigidos se 
duas medidas dependentes forem usadas. O tamanho amos- 
tral exigido aumenta para 185 por grupo se oito variáveis 
dependentes são consideradas. 


Como podemos ver, as vantagens de se utilizarem 
múltiplas medidas dependentes surgem com um custo em 
nossa análise. Desse modo, o pesquisador sempre deve 
equilibrar o emprego de mais medidas dependentes ver- 
sus os benefícios da parcimônia no conjunto de variáveis 
dependentes que ocorrem não apenas na interpretação, 
mas também nos testes estatísticos para diferenças de 
grupos. 


Cálculo de níveis de poder Para calcular o poder para 
análises ANOVA, há publicações [3,24] e programas 
disponíveis. Os métodos para computar o poder de MA- 
NOVA, porém, são muito mais limitados. Felizmente, a 
maioria dos programas de computador fornece uma ava- 
liação de poder para os testes de significância e permite ao 
pesquisador determinar se o poder deve ter um papel na 
interpretação dos resultados. 

Em termos de material publicado para fins de delinea- 
mento, existe pouca coisa para MANOVA, pois muitos 
elementos afetam o poder de uma análise MANOVA. O 
pesquisador, porém, deve utilizar as ferramentas dispo- 
níveis para ANOVA e então promover ajustes descritos 
para aproximar o poder de um planejamento MANOVA. 


Uso do poder no planejamento e na análise 

A estimação de poder deve ser usada tanto no delinea- 
mento da análise quanto na avaliação dos resultados. No 
estágio de planejamento, o pesquisador determina o ta- 
manho amostral necessário para identificar o tamanho de 
efeito estimado. Em muitos casos, o tamanho do efeito 
pode ser estimado a partir de pesquisa anterior ou de al- 
gum tipo de julgamento, ou mesmo ser estabelecido em 
um nível mínimo de significância prática. Em cada caso, o 
tamanho amostral necessário para atingir um dado nível 
de poder com um nível alfa especificado pode ser deter- 
minado. 

Avaliando o poder dos critérios de teste depois que a 
análise tenha sido concluída, o pesquisador fornece um 
contexto para interpretar os resultados, especialmen- 
te se não foram encontradas diferenças significantes. O 
pesquisador deve primeiramente determinar se o poder 
atingido é suficiente (0,80 ou mais). Caso contrário, a 
análise pode ser reformulada para fornecer mais poder? 
Uma possibilidade inclui alguma forma de tratamento 
por bloqueio ou análise covariada que tornarão o teste 
mais eficiente, acentuando-se o tamanho do efeito. Se o 
poder for adequado e não tiver sido encontrada signi- 
ficância estatística para um efeito do tratamento, então 
muito provavelmente o tamanho do efeito para o trata- 
mento foi muito pequeno para ter significância estatísti- 
ca ou prática. 


TABELA 6-3 Exigências de tamanho de amostra por grupo para se atingir poder estatístico de 0,80 em MANOVA 


NÚMERO DE GRUPOS 
3 4 5 
Número de variáveis dependentes Número de variáveis dependentes Número de variáveis dependentes 
Tamanho de efeito 2 4 6 8 2 4 6 8 2 4 6 8 
Muito grande 13 16 18 21 14 18 21 23 16 21 24 27 
Grande 26 33 38 42 29 37 44 46 34 ad 52 58 
Médio 44 56 66 72 50 64 74 84 60 76 90 100 
Pequeno 98 125 145 160 115 145 165 185 135 170 200 230 


Fonte: J. Lâuter, “Sample Size Requirements for the Tº Test of MANOVA (Tables for One-Way Classification)” Biometrical Journal 20 (1978): 389-406. 


CAPÍTULO 6 Análise Multivariada de Variância 327 


Os efeitos da multicolinearidade de 

variáveis dependentes sobre o poder 

Até este ponto, discutimos o poder sob uma perspectiva 
aplicávela ANOVA e MANOVA. No entanto, em MA- 
NOVA, o pesquisador também deve considerar os efeitos 
de multicolinearidade das variáveis dependentes sobre o 
poder dos testes estatísticos. O pesquisador, no estágio de 
delineamento ou análise, deve considerar a força e a di- 
reção das correlações, bem como os tamanhos de efeitos 
sobre as variáveis dependentes. Se classificamos as variá- 
veis por seus tamanhos de efeitos como fortes ou fracas, 
diversos padrões emergem [4]. 


e Primeiro, se o par de variáveis correlacionadas é formado 
por variáveis forte-forte ou fraca-fraca, então o maior po- 
der é alcançado quando a correlação entre variáveis é al- 
tamente negativa. Isso sugere que MANOVA é otimizada 
acrescentando-se variáveis dependentes que tenham altas 
correlações negativas. Por exemplo, ao invés de incluir duas 
medidas redundantes de satisfação, o pesquisador pode 
substituí-las por medidas correlacionadas de satisfação e in- 
satisfação para aumentar o poder. 

e Quando o par de variáveis correlacionadas é uma mistura 
(forte-fraca), o poder é maximizado quando a correlação é 
alta, sendo positiva ou negativa. 

e Uma exceção a esse padrão geral é o fato de que o uso de 
múltiplos itens para aumentar a confiabilidade resulta em 
um ganho líquido de poder, mesmo quando os itens são re- 
dundantes e positivamente correlacionados. 


Revisão do poder em MANOVA 

Uma das mais importantes considerações em uma MA- 
NOVA bem sucedida é o poder estatístico da análise. 
Ainda que pesquisadores empenhados em experimentos 
tenham muito maior controle sobre os três elementos 
que afetam poder, eles devem se assegurar de abordar as 
questões levantadas nas seções anteriores, senão podem 
facilmente ocorrer problemas potenciais que reduzam 
o poder abaixo do valor desejado de 0,80. Em pesquisa 
de campo, o pesquisador está diante não apenas de uma 
menor certeza sobre os tamanhos de efeitos na análise, 
mas também da falta de controle sobre tamanhos de gru- 
pos e de grupos potencialmente pequenos que podem 
acontecer no processo de amostragem. Assim, questões 
no planejamento e na execução da pesquisa de campo 
discutidas no estágio 2 são igualmente críticas em uma 
análise bem sucedida. 


ESTÁGIO 5: INTERPRETAÇÃO 
DOS RESULTADOS MANOVA 


Assim que a significância estatística dos tratamentos ti- 
ver sido avaliada, o pesquisador volta sua atenção para o 
exame dos resultados para compreender como cada trata- 
mento afeta as medidas dependentes. Fazendo isso, uma 
série de três passos deve ser seguida: 


REGRAS PRÁTICAS 6-4 


Estimação MANOVA 


As quatro medidas mais usadas para avaliar 
significância estatística entre grupos quanto às variáveis 
independentes* são: 

e A maior raiz característica de Roy 

e Lambda de Wilks 

e Critério de Pillai 

e Traço de Hotelling 

Na maioria das situações os resultados/conclusões serão 
os mesmos em todas as quatro medidas, mas em alguns 


casos únicos eles serão diferentes entre as medidas 


Manter poder estatístico adequado é crucial: 
e Poder na faixa de 0,80 para o nível alfa escolhido é 
aceitável 
Quando o tamanho de efeito é pequeno, o 
pesquisador deve usar tamanhos amostrais maiores 
por grupo para manter níveis aceitáveis de poder 
estatístico 
O modelo linear geral (GLM) é amplamente usado 
hoje em dia para teste de modelos ANOVA ou 
MANOVA; GLM está disponível na maioria dos 
pacotes estatísticos, como SPSS e SAS 


1. Interpretação dos efeitos de covariáveis, se empregadas 

2. Avaliação de qual(ais) variável(eis) dependente(s) exibe(m) 
diferenças nos grupos de cada tratamento. 

3. Identificação de quais grupos diferem em uma única variável 
dependente ou na variável estatística dependente inteira. 


Primeiro, examinamos os métodos pelos quais as co- 
variáveis significantes e variáveis dependentes são identi- 
ficadas, e então abordamos os métodos pelos quais as di- 
ferenças entre grupos individuais e variáveis dependentes 
podem ser medidas. 


Avaliação de covariáveis estatísticas 


Covariáveis podem ter um importante papel ao se inclui- 
rem variáveis métricas em um planejamento MANOVA ou 
ANOVA. No entanto, uma vez que covariáveis atuam como 
medida de controle sobre a variável estatística dependen- 
te, elas devem ser avaliadas antes que os tratamentos sejam 
examinados. Tendo atendido às suposições para aplicar co- 
variáveis, o pesquisador pode interpretar o efeito real das 
covariáveis sobre a variável estatística dependente e seu im- 
pacto sobre os testes estatísticos reais dos tratamentos. 


Avaliação do impacto geral 

O papel mais importante das covariáveis é o impacto ge- 
ral nos testes estatísticos para os tratamentos. A aborda- 
gem mais direta para avaliar tais impactos é executar a 
análise com e sem as covariáveis. As covariáveis efetivas 


*N. deR.T.: A frase correta seria “sobre as variáveis dependentes”. 
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melhoram o poder estatístico dos testes e reduzem a va- 
riância dentro dos grupos. Se o pesquisador não perceber 
qualquer melhora substancial, então as covariáveis po- 
dem ser eliminadas, pois elas reduzem os graus de liber- 
dade disponíveis para os testes dos efeitos do tratamento. 
Essa abordagem também pode identificar casos nos quais 
a covariável é muito poderosa e reduz a variância a um 
ponto em que os tratamentos são todos não-significantes. 
Geralmente isso ocorre quando uma covariável incluída 
é correlacionada com uma das variáveis independentes e, 
assim, remove essa variância, reduzindo, portanto, o po- 
der explicativo da variável independente. 


Interpretação das covariáveis 

Como ANCOVA e MANCOVA são aplicações de proce- 
dimentos de regressão dentro do método de análise de va- 
riância, avaliar o impacto das covariáveis sobre as variáveis 
dependentes é bastante semelhante ao exame de equações 
de regressão. Se o impacto geral é considerado significante, 
então cada covariável estatística pode ser examinada quan- 
to a força da relação preditiva com as medidas dependen- 
tes. Se as covariáveis representam efeitos teóricos, então 
esses resultados fornecem uma base objetiva para aceitar 
ou rejeitar as relações propostas. De um ponto de vista prá- 
tico, o pesquisador pode examinar o impacto das covariá- 
veis e eliminar aquelas com pouco ou nenhum efeito. 


Avaliação dos efeitos sobre a 
variável estatística dependente 


Com os eventuais impactos das covariáveis explicadas na 
análise, o próximo passo é examinar os impactos de cada 
tratamento (variável independente) sobre as variáveis de- 
pendentes. Ao fazer isso, primeiro discutimos como avaliar 
as diferenças atribuíveis a cada tratamento. Com os efeitos 
de tratamento estabelecidos, avaliamos em seguida se eles 
são independentes no caso de dois ou mais tratamentos. Fi- 
nalmente, examinamos se os efeitos dos tratamentos se es- 
tendem para o conjunto inteiro de medidas dependentes ou 
se são refletidos apenas em um subconjunto de medidas. 


Efeitos principais dos tratamentos 

Já discutimos as medidas disponíveis para avaliar a signi- 
ficância estatística de um tratamento. Quando um efeito 
significante é encontrado, chamamos o mesmo de efeito 
principal, o que significa que diferenças significantes entre 
dois ou mais grupos são definidas pelo tratamento. Com 
dois níveis no tratamento, um efeito principal significante 
garante que os dois grupos são significantemente diferen- 
tes. Com três ou mais níveis, porém, um efeito principal 
significante não garante que todos os três grupos sejam 
significantemente distintos, mas que pelo menos uma di- 
ferença significante está presente em um par de grupos. 
Como vemos na próxima seção, muitos testes estatísticos 
estão disponíveis para avaliar quais grupos diferem quanto 
à variável estatística e quanto a cada variável dependente. 


Assim, como retratamos um efeito principal? Um efei- 
to principal é tipicamente descrito pela diferença entre 
grupos nas variáveis dependentes na análise. Considere 
que sexo tem um efeito principal significante sobre uma 
escala de satisfação de 10 pontos. Podemos então obser- 
var diferença em médias como uma maneira de descre- 
ver o impacto. Se o grupo de mulheres tivesse um escore 
médio de 7,5 e os homens 6,0, poderíamos dizer que a 
diferença devido a sexo foi de 1,5. Logo, se todo o resto 
for igual, espera-se que mulheres marquem 1,5 pontos a 
mais do que os homens. 


No entanto, definir um efeito principal nesses termos 
exige duas análises adicionais: 


1. Se a análise incluir mais de um tratamento, o pesquisador 
deve examinar os termos de interação para saber se eles são 
significantes e, em caso positivo, se eles permitem uma in- 
terpretação dos efeitos principais. 

2. Se um tratamento envolve mais de dois níveis, então o pes- 
quisador deve executar uma série de testes adicionais nos 
grupos para ver quais pares são significantemente diferentes. 


Discutimos a interpretação de termos de interação na 
próxima seção e em seguida examinamos os tipos de tes- 
tes estatísticos disponíveis para avaliação de diferenças de 
grupos quando a análise envolve mais de dois grupos. 


Impactos dos termos de interação 

O termo de interação representa o efeito conjunto de 
dois ou mais tratamentos. Sempre que um planejamento 
de pesquisa tiver dois ou mais tratamentos, o pesquisa- 
dor deve primeiramente examinar as interações antes que 
qualquer declaração possa ser feita sobre os efeitos prin- 
cipais. Primeiro, discutimos como identificar interações 
significantes. Em seguida, discutimos como classificá-las a 
fim de interpretar o impacto das mesmas sobre os efeitos 
principais das variáveis de tratamento. 


Avaliação de significância estatística. Efeitos de inte- 
ração são avaliados com os mesmos critérios dos efeitos 
principais, a saber, testes estatísticos multivariados e uni- 
variados e poder estatístico. Programas de computador 
fornecem um conjunto completo de resultados para cada 
termo de interação além dos efeitos principais. Todos os 
critérios discutidos anteriormente se aplicam na avaliação 
de interações e de efeitos principais. 

Testes estatísticos que indicam que a interação é não- 
significante denotam os efeitos independentes dos trata- 
mentos. Independência em planejamentos fatoriais signi- 
fica que o efeito de um tratamento (ou seja, diferenças de 
grupos) é o mesmo para cada nível dos demais tratamentos 
e que os efeitos principais podem ser diretamente interpre- 
tados. Aqui podemos descrever as diferenças entre grupos 
como constantes quando consideradas em combinação com 
o segundo tratamento. Discutimos interpretação do efeito 
principal em um exemplo simples numa seção adiante. 
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Se as interações são consideradas estatisticamente 
significantes, é crucial que o pesquisador identifique o 
tipo de interação (ordinal ou desordinal), pois ela tem 
impacto direto sobre a conclusão que pode ser extraída 
a partir dos resultados. Como vemos na próxima seção, 
interações podem potencialmente confundir qualquer 
descrição dos efeitos principais dependendo da sua na- 
tureza. 


Tipos de interações significantes. A significância estatís- 
tica de um termo de interação é feita com os mesmos cri- 
térios estatísticos usados para avaliar o impacto de efeitos 
principais. Ao avaliar a significância do termo de intera- 
ção, o pesquisador deve examinar efeitos do tratamento 
(ou seja, as diferenças entre grupos) para determinar o 
tipo de interação e o impacto da mesma sobre a interpre- 
tação do efeito principal. Interações significantes podem 
ser classificadas em dois tipos: interações ordinais e não- 
ordinais (ou desordinais). 


Interações ordinais. Quando os efeitos de um tra- 
tamento não são iguais em todos os níveis de outro tra- 
tamento, mas as diferenças de grupos estão sempre na 
mesma direção, chamamos isso de interação ordinal. Em 
outras palavras, as médias de grupos para um nível são 
sempre maiores/menores do que outro nível do mesmo 
tratamento, não importando como elas são combinadas 
com o outro tratamento. 


Considere que dois tratamentos (sexo e idade) são usa- 
dos para examinar satisfação. Uma interação ordinal 
acontece, por exemplo, quando mulheres estão sempre 
mais satisfeitas do que homens, mas a diferença entre 
homens e mulheres difere de acordo com a faixa etária 
do grupo. 


Quando interações significantes são ordinais, o pes- 
quisador deve interpretar o termo de interação para ga- 
rantir que seus resultados sejam conceitualmente acei- 
táveis. Aqui o pesquisador deve identificar onde ocorre 
a variação em diferenças de grupos e como a mesma se 
relaciona com o modelo conceitual inerente à análise. Se 
assim for, então os efeitos de cada tratamento devem ser 
descritos em termos dos outros tratamentos com os quais 
interage. 


No exemplo anterior, podemos fazer a afirmação geral 
de que sexo afeta satisfação no sentido de que mulheres 
estão sempre mais satisfeitas do que homens. No entan- 
to, o pesquisador não pode estabelecer a diferença em 
termos simples como poderia ser feito com um efeito 
principal simples. Ao invés disso, as diferenças em sexo 
devem ser descritas para cada categoria etária, pois as 
diferenças homem/mulher variam com a idade. 


Interações não-ordinais. Quando as diferenças en- 
tre níveis trocam, dependendo de como elas são combina- 
das com níveis de outro tratamento, isso passa a se chamar 
de interação desordinal. Aqui os efeitos de um tratamento 
são positivos para alguns níveis e negativos para outros do 
outro tratamento. 


Em nosso exemplo de exame de satisfação por sexo e 
idade, acontece uma interação desordinal quando mu- 
lheres têm maior satisfação do que homens em algumas 
categorias etárias, mas homens são mais satisfeitos em 
outras categorias de idade. 


Se a interação significante é considerada não-ordinal, 
então os efeitos principais dos tratamentos envolvidos na 
interação não podem ser interpretados e o estudo deve ser 
refeito. Esta sugestão provém do fato de que, com intera- 
ções não-ordinais, os efeitos principais variam não apenas 
nos níveis de tratamento, mas também na direção (posi- 
tiva ou negativa). Logo, os tratamentos não representam 
um efeito consistente. 


Um exemplo de interpretação de interações. Interações 
representam as diferenças entre médias de grupos quan- 
do reunidas por níveis de outra variável de tratamento. 
Mesmo que pudéssemos interpretar interações vendo 
uma tabela de valores, representações gráficas são muito 
efetivas na identificação do tipo de interação entre dois 
tratamentos. O resultado é um gráfico de múltiplas linhas, 
com níveis de um tratamento representados sobre o eixo 
horizontal. Cada linha representa, desse modo, um nível 
da segunda variável de tratamento. 


A Figura 6-5 retrata cada tipo de interação usando o 
exemplo de interações entre dois tratamentos: formas e 
cores de cereal. Formas de cereal têm três níveis (bolas, 
cubos e estrelas) e cores também (vermelho, azul e ver- 
de). O eixo vertical representa as avaliações médias (a 
variável dependente) de cada grupo de respondentes ao 
longo das combinações de níveis de tratamento. O eixo 
X representa as três categorias para cor (vermelho, azul 
e verde). As linhas conectam as médias de categoria para 
cada forma nas três cores. Por exemplo, no gráfico supe- 
rior o valor para bolas vermelhas é de aproximadamente 
4,0, 0 valor para bolas azuis fica em torno de 5,0, e o valor 
aumenta um pouco para 5,5 no caso de bolas verdes. 

Como os gráficos identificam o tipo de interação? 
Como discutimos adiante, cada uma das três interações 
tem um padrão específico: 


e Sem interações. Mostrado pelas retas paralelas represen- 
tando as diferenças das várias formas ao longo dos níveis 
de cor (o mesmo efeito seria visto se as diferenças em cor 
fossem graficamente representadas nos três tipos de for- 


ma). No caso de ausência de interação, os efeitos de cada 
(Continua) 
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(Continuação) 
tratamento (as diferenças entre grupos) são constantes 


em cada nível e as retas são mais ou menos paralelas. 

e Interação ordinal. Os efeitos de cada tratamento não 
são constantes, e assim as retas não são paralelas. As di- 
ferenças para vermelho são grandes, mas elas diminuem 
suavemente para cereal azul e até mais para cereal ver- 
de. Logo, as diferenças por cor variam ao longo das for- 
mas. A ordem relativa entre níveis de forma é a mesma, 
porém, com estrelas sempre acima, seguidas por cubos e 
então por bolas.* 

e Interação desordinal. As diferenças em cor variam não 
apenas em magnitude mas também em direção. Esta in- 
teração é exibida pelas retas que não são paralelas e que 
cruzam entre níveis. Por exemplo, bolas têm uma avalia- 
ção maior do que cubos e estrelas quando a cor é verme- 
lha, mas a avaliação é menor para as cores azul e verde.** 


Os gráficos complementam os testes de significância esta- 
tística permitindo que o pesquisador classifique rapidamen- 
te a interação, especialmente determinando se interações 
significantes recaem nas categorias ordinal ou desordinal. 


Identificação de diferenças 

entre grupos individuais 

Apesar de os testes univariados e multivariados de ANO- 
VA e MANOVA nos permitirem rejeitar a hipótese nula 
de que as médias de grupos são todas iguais, eles não 
apontam com precisão onde estão as diferenças signifi- 
cantes quando há mais de dois grupos. Múltiplos testes t 
sem qualquer forma de ajuste não são apropriados para 
avaliar a significância de diferenças entre as médias de 
pares de grupos porque a probabilidade de um erro Tipo 
I aumenta com o número de comparações entre grupos 
realizadas (semelhante ao problema de usar múltiplas 
ANOVAs univariadas versus MANOVA). Muitos proce- 
dimentos estão disponíveis para uma maior investigação 
de diferenças específicas de médias de grupos que sejam 
de interesse, usando diferentes abordagens para controlar 
taxas de erro Tipo I ao longo de múltiplos testes. 


Múltiplos testes univariados ajustando 

a taxa de erro experimental 

Muitas vezes o método mais simples é executar uma série de 
testes univariados com alguma forma de ajuste manual feito 
pelo pesquisador para explicar a taxa de erro experimental. 
Pesquisadores podem fazer tais ajustes procurando saber se 
os tratamentos envolvem dois ou mais níveis (grupos). 


Análises de dois grupos. Tratamentos de dois grupos 
se reduzem a uma série de testes t ao longo das medidas 


* N. de R.T.: A frase correta seria “...com bolas sempre acima, segui- 
das por cubos e então por estrelas”. 
** N. de R. T.: A frase correta seria “as bolas têm uma avaliação mais alta do 
que os cubos e as estrelas para as cores vermelha e azul, mas a avaliação é 
menor para a cor verde”. 


dependentes especificadas. No entanto, os pesquisadores 
devem estar cientes de que, quando o número desses tes- 
tes aumenta, um dos maiores benefícios da abordagem 
multivariada para os testes de significância — controle da 
taxa de erro Tipo 1 — é negado, a menos que sejam reali- 
zados ajustes específicos na estatística Tº para controlar a 
inflação do erro Tipo I. 

Se desejamos testar as diferenças de grupos individu- 
almente para cada uma das variáveis dependentes, pode- 
mos usar a raiz quadrada de 7”... (ou seja, T..) como o va- 
lor crítico necessário para estabelecer significância. Esse 
procedimento garantiria que a probabilidade de qualquer 
erro Tipo I ao longo de todos os testes se manteria em à 
(onde o é especificado no cálculo de Tº..) [11]. 


Análises de k grupos. Poderíamos fazer testes semelhan- 
tes para situações com k grupos ajustando o nível o pela 
desigualdade de Bonferroni, a qual estabelece que o nível 
alfa deve ser ajustado para o número de testes em execu- 
ção. O nível alfa ajustado usado em qualquer teste separa- 
do é definido como o nível alfa geral dividido pelo número 
de testes [alfa ajustado o. = (o geral)/(número de testes)]. 


Por exemplo, se a taxa de erro geral (ot) é 0,05 e 
cinco testes estatísticos devem ser feitos, então um 
ajuste Bonferroni exigiria um nível 0,01 para ser 
utilizado para cada teste individual. 


Testes multigrupos estruturados 

Os procedimentos descritos na seção anterior são melhor 
usados em situações simples com poucos testes sendo con- 
siderados. Se o pesquisador deseja examinar sistematica- 
mente diferenças de grupos em pares específicos quanto a 
uma ou mais medidas dependentes, mais testes estatísticos 
estruturados devem ser usados. Nesta seção examinamos 
dois tipos de testes: 


e Testes post hoc. Testes das variáveis dependentes entre to- 
dos os possíveis pares de diferenças de grupos que são exa- 
minados depois que padrões de dados são estabelecidos. 

e Testes a priori. Testes planejados a partir de um ponto de 
vista teórico ou prático anterior ao exame dos dados. 


A principal diferença entre os dois tipos é que a abor- 
dagem post hoc testa todas as possíveis combinações, via- 
bilizando uma maneira simples de comparação de grupos 
mas ao custo de poder menor. Testes a priori examinam 
apenas comparações especificadas, de modo que o pes- 
quisador deve definir explicitamente a comparação a ser 
feita, mas com um nível maior de poder como resulta- 
do. Qualquer método pode ser empregado no exame de 
uma ou mais diferenças entre grupos, apesar de os testes 
a priori também fornecerem ao pesquisador um controle 
total sobre os tipos de comparações feitas entre grupos. 


Métodos post hoc. Métodos post hoc são amplamen- 
te usados por conta da facilidade com que múltiplas 
comparações são executadas. Entre os procedimentos 
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FIGURA 6-5 Efeitos de interação em planejamentos fatoriais. 
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post hoc mais comuns estão (1) o método Scheffé, (2) o 
método da diferença honestamente significante (HSD) 
de Tukey, (3) a extensão de Tukey para a abordagem 
da mínima diferença significante (LSD) de Fisher, (4) o 
teste da amplitude múltipla de Duncan e (5) o teste de 
Newman-Keuls. 

Cada método identifica quais comparações entre gru- 
pos (p.ex., grupo 1 versus grupos 2 e 3) têm diferenças 
significantes. Apesar de simplificarem a identificação de 
diferenças de grupos, todos esses métodos compartilham 
o problema de ter níveis muito baixos de poder para qual- 
quer teste individual, pois eles examinam todas as possí- 
veis combinações. Esses cinco testes de significância post 
hoc ou de comparação múltipla foram comparados quan- 
to a poder [23], e diversas conclusões foram obtidas. 


e O método de Scheffé é o mais conservador em relação 
ao erro Tipo I, e os demais testes são classificados nesta 
ordem: HSD de Tukey, LSD de Tukey, Newman-Keuls e 
Duncan. 

e Se os tamanhos de efeitos são grandes ou o número de gru- 
pos é pequeno, os métodos post hoc podem identificar as 
diferenças de grupos. Mas o pesquisador também deve re- 
conhecer as limitações desses métodos e empregar outras 
técnicas se for possível identificar comparações mais espe- 
cíficas. 


Uma discussão sobre as opções disponíveis com cada 
método está além do escopo deste capítulo. Excelentes 
discussões e explicações desses procedimentos podem ser 
encontradas em outros textos [13, 27]. 


Comparações a priori ou planejadas. O pesquisador 
também pode fazer comparações específicas entre grupos 
usando testes a priori (também conhecidos como compa- 
rações planejadas). Esse método é semelhante aos testes 
post hoc nas técnicas estatísticas para realizar compara- 
ções de grupos, mas difere em planejamento e controle 
pelo pesquisador em três aspectos: 


e O pesquisador especifica quais comparações de grupos de- 
vem ser feitas versus o teste do conjunto inteiro, como feito 
nos testes post hoc. 

e As comparações planejadas são mais poderosas porque o 
número de comparações é menor, mas o maior poder não é 
muito útil se o pesquisador não testa especificamente com- 
parações corretas de grupos. 

e As comparações planejadas são mais apropriadas quando 
bases conceituais podem apoiar as comparações específicas 
a serem feitas. No entanto, não devem ser utilizadas de uma 
maneira exploratória, pois elas não têm controles efetivos 
contra o aumento de níveis experimentais de erro Tipo I. 


O pesquisador especifica os grupos a serem compara- 
dos por meio de um contraste, o qual é uma combinação 
de médias de grupos que representa uma comparação 
planejada específica. Os contrastes geralmente podem ser 
dados como 


C=-WG+W,G+...+WG, 


onde 


C= valor do contraste 
W= pesos 
G = médias de grupos 


O contraste é formulado designando-se pesos positivos 
e negativos para especificar os grupos a serem compara- 
dos, ao mesmo tempo garantindo-se que os pesos somem 
Zero. 


Por exemplo, considere que tenhamos três médias de 
grupos (G,, G, e G;). Para testar uma diferença entre G, 
e G, (e ignorando G, para esta comparação), o contraste 
seria: 


C= (16, + (DG, + (0)G; 


Para testar se a média de G, e G, difere de G,, o con- 
traste é: 


C=(05)6, + (0,5)G, + (-1) G, 


Uma estatística F separada é computada para cada 
contraste. 


Desse modo, o pesquisador pode criar quaisquer com- 
parações desejadas e testá-las diretamente, mas a proba- 
bilidade de um erro Tipo I para cada comparação a priori 
é igual a q. Assim, diversas comparações planejadas au- 
mentarão o nível geral de erro Tipo I. Todos os pacotes 
estatísticos podem executar testes a priori ou post hoc 
para variáveis dependentes individuais ou para a variável 
estatística. 

Se o pesquisador deseja realizar comparações da va- 
riável estatística dependente inteira, extensões desses mé- 
todos estão disponíveis. Depois de concluir que os vetores 
médios de grupos não são equivalentes, o pesquisador 
pode se interessar em saber se há diferenças de grupos na 
variável estatística dependente composta. Uma estatística 
F ANOVA padrão pode ser calculada e comparada com 
Fou= (N — k)gcra/(k — 1), onde o valor de ger, é obtido 
a partir da distribuição gcr com graus de liberdade apro- 
priados. Muitos pacotes computacionais têm a habilidade 
de realizar comparações planejadas para a variável esta- 
tística dependente, bem como para variáveis dependentes 
individuais. 


Avaliação da significância em 
variáveis dependentes individuais 


Até o presente momento examinamos apenas os testes 
multivariados de significância para o conjunto de variá- 
veis dependentes. E quanto a cada uma delas? Uma di- 
ferença significante com um teste multivariado garante 
que cada variável dependente também é significativa- 
mente diferente? Ou um efeito não-significante signifi- 
ca que todas as variáveis dependentes também têm dife- 
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renças não-significantes? Em ambos os casos, a resposta 
é negativa. O resultado de um teste multivariado de di- 
ferenças no conjunto de medidas dependentes não se es- 
tende necessariamente para cada variável em separado, 
mas apenas coletivamente. Logo, o pesquisador sempre 
deve examinar como os resultados multivariados se es- 
tendem para medidas dependentes individuais. 


Testes de significância univariados. O primeiro passo 
é avaliar quais das variáveis dependentes contribuem 
para as diferenças gerais indicadas pelos testes estatís- 
ticos. Este passo é essencial porque um subconjunto de 
variáveis no conjunto das dependentes pode acentuar 
as diferenças, enquanto outro subconjunto pode ser 
não-significante ou mascarar os efeitos significantes das 
demais. 

A maioria dos pacotes estatísticos fornece testes de 
significância univariados para cada medida dependente, 
além dos testes multivariados, fornecendo uma avaliação 
individual de cada variável. O pesquisador pode então de- 
terminar como cada variável dependente corresponde aos 
efeitos sobre a variável estatística. 


Análise stepdown. Um procedimento conhecido como 
análise stepdown [16,23] também pode ser usado para 
avaliar individualmente as diferenças das variáveis de- 
pendentes. Esse procedimento envolve a computação de 
uma estatística F univariada para uma variável depen- 
dente depois de eliminar os efeitos de outras variáveis 
dependentes que a precedem na análise. O procedimen- 
to é um pouco semelhante à regressão stepwise, mas aqui 
examinamos se uma variável dependente em particular 
contribui com informações únicas (não-correlacionadas) 
para as diferenças de grupos. Os resultados stepdown se- 
riam exatamente os mesmos se fizéssemos uma análise 
covariada, com as outras variáveis dependentes prece- 
dentes usadas como as covariáveis. 

Uma suposição crítica da análise stepdown é que o 
pesquisador deve conhecer a ordem na qual as variáveis 
dependentes devem ser introduzidas, pois as interpreta- 
ções podem variar dramaticamente com diferentes or- 
dens de entrada. Se a ordenação tem apoio teórico, en- 
tão o teste stepdown é válido. Variáveis indicadas como 
não-significantes são redundantes em relação às variáveis 
significantes anteriores, e elas não acrescentam informa- 
ções referentes a diferenças entre grupos. A ordem das 
variáveis dependentes pode ser mudada para testar se os 
efeitos de variáveis são redundantes ou particulares, mas 
o processo fica mais complicado quando o número de va- 
riáveis dependentes aumenta. 

Essas duas análises são direcionadas para auxiliar o 
pesquisador a compreender quais variáveis dependentes 
contribuem para as diferenças na variável estatística de- 
pendente ao longo do(s) tratamento(s). 


ESTÁGIO 6: VALIDAÇÃO 
DOS RESULTADOS 


Análises de técnicas de variância (ANOVA e MANOVA) 
foram desenvolvidas na tradição de experimentação, sendo 
a repetição o principal meio de validação. A especificidade 
de tratamentos experimentais permite um amplo uso do 
mesmo experimento em múltiplas populações para avaliar 
a generalidade dos resultados. Apesar de este ser um prin- 
cípio fundamental do método científico, em pesquisas de 
ciências sociais e nos negócios, a verdadeira experimenta- 
ção muitas vezes é substituída por testes estatísticos em si- 
tuações não-experimentais, como sondagens. A habilidade 
de validar os resultados nessas situações é baseada na repe- 
titividade dos tratamentos. Em muitos casos, características 
demográficas como idade, sexo, renda e outras são usadas 
como tratamentos. Esses tratamentos podem parecer aten- 
der à exigência de comparabilidade, mas o pesquisador 
deve garantir que o elemento adicional de se designar alea- 
toriamente a uma célula também seja atendido; no entanto, 
em pesquisas, isso muitas vezes não acontece. 


Por exemplo, ter idade e sexo como as variáveis inde- 
pendentes é um exemplo comum do uso de ANOVA 
ou MANOVA em pesquisas. Em termos de validação, 
o pesquisador deve ser cuidadoso ao analisar múltiplas 
populações e comparar resultados como a única prova 
de validade. Como os respondentes, em um certo sen- 
tido, selecionam a si mesmos, os tratamentos neste caso 
não podem ser designados pelo pesquisador, e assim a 
designação aleatória é impossível. 


Logo, o pesquisador deve considerar seriamente o uso 
de covariáveis para controlar outras características que 
possam ser específicas dos grupos de idade ou sexo e que 
poderiam afetar as variáveis dependentes, mas não são in- 
cluídas na análise. 

Outra questão é a alegação de causa quando métodos 
ou técnicas experimentais são empregados. Os princípios 
de causalidade são examinados em maiores detalhes no 
Capítulo 10. Para nossos propósitos aqui, o pesquisador 
deve lembrar que em todos os ambientes de pesquisa, in- 
cluindo experimentos, certos critérios conceituais (p.ex., 
ordem temporal de efeitos e resultados) devem ser esta- 
belecidos antes que a causalidade possa ser apoiada. Uma 
única aplicação de uma técnica particular usada em um 
experimento não garante causalidade. 


RESUMO 


Discutimos as aplicações apropriadas e considerações im- 
portantes de MANOVA ao abordarmos as análises mul- 
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tivariadas com medidas dependentes múltiplas. Apesar 
de haver benefícios consideráveis em seu uso, MANOVA 
deve ser cuidadosa e adequadamente aplicada à questão em 
mãos. Quando isso é feito, os pesquisadores têm à sua dis- 
posição uma técnica com flexibilidade e poder estatístico. 
Agora ilustramos as aplicações de MANOVA (e sua con- 
traparte univariada ANOVA) em uma série de exemplos. 


ILUSTRAÇÃO DE UMA 
ANALISE MANOVA 


Análise multivariada de variância (MANOVA) propor- 
ciona aos pesquisadores a habilidade de avaliar diferenças 
em uma ou mais variáveis independentes não-métricas 
para um conjunto de variáveis dependentes métricas. 
Ela proporciona uma maneira para determinar a exten- 
são em que grupos de respondentes (formados por suas 
características nas variáveis independentes não-métricas) 
diferem em termos de medidas dependentes. O exame de 
tais diferenças pode ser feito separadamente ou em com- 
binação. Nas seções a seguir, detalhamos a análise neces- 
sária para examinar duas características (X, e X,) quanto 
a seu impacto em um conjunto de resultados de compra 
(X o» Xp € X,,). Primeiro, analisamos cada característica 
separadamente, e em seguida ambas em combinação. O 
leitor deve notar que uma versão expandida de HBAT 
(HBAT200 com uma amostra de 200) é usada nesta aná- 
lise para viabilizar o estudo de um planejamento de dois 
fatores. Este conjunto de dados está disponível na Web 
em www.bookman.com.br. 


Nos últimos anos tem crescido a atenção para a área de 
sistemas de distribuição. Abastecida pelo amplo uso de 
sistemas baseados na internet para integração de canais 
e pelas economias de custo sendo percebidas por siste- 
mas logísticos melhorados, a administração da HBAT 
está interessada em avaliar o estado atual de transações 
em seu sistema de distribuição, o qual utiliza canais indi- 
retos (via corretores) e diretos. No canal indireto, produ- 
tos são vendidos para clientes por corretores que atuam 
como equipe de venda externa e, em alguns casos, como 
atacadistas. A HBAT também emprega uma equipe de 
venda própria; eles contatam e atendem clientes direta- 
mente a partir de escritórios da corporação, bem como 
escritórios externos. 

Surgiu a preocupação de que mudanças podem ser 
necessárias no sistema de distribuição, focando-se par- 
ticularmente o sistema de corretores que é observado 
como tendo um desempenho insatisfatório, especial- 


mente no estímulo de relações de longo prazo com a 
(Continua) 


REGRAS PRÁTICAS 6-5 


Interpretação e validação de resultados 
de MANOVA 


e Quando covariáveis estão envolvidas em um modelo 


GLM: 
e Analise o modelo com e sem as covariáveis 
e Se as covariáveis não melhoram o poder estatístico 
ou não têm qualquer impacto sobre a significância 
dos efeitos de tratamento, então elas podem ser 
dispensadas na análise final 
Sempre que duas ou mais variáveis independentes 
(tratamentos) são incluídas na análise, interações 
devem ser examinadas antes de se tirarem conclusões 
sobre efeitos principais para qualquer variável 
independente 
e Seas interações não são estatisticamente 
significantes, então efeitos principais podem 
ser diretamente interpretados, pois a diferença 
entre tratamentos é considerada constante nas 
combinações de níveis 
Se a interação é estatisticamente significante e 
as diferenças não são constantes ao longo das 
combinações de níveis, então a interação deve ser 
determinada como sendo ordinal ou desordinal: 
e Interações ordinais significam que a direção de 
diferenças não varia por nível (p.ex., homens 


sempre menos que mulheres), apesar de a 
diferença entre homens e mulheres variar 
por nível no outro tratamento; neste caso, o 
tamanho do efeito principal (p.ex., homens 
versus mulheres) deve ser descrito apenas 
separadamente para cada nível do outro 
tratamento 


Interações significantes não-ordinais acontecem 
quando a direção de um efeito principal 
observado muda com o nível de outro tratamento 
(p.ex., homens maiores do que mulheres 

para um nível e menores que mulheres para 
outro); interações não-ordinais interferem na 
interpretação de efeitos principais 


e Quando a variável independente tem mais de dois 


grupos, dois tipos de procedimentos podem ser usados 

para isolar a fonte de diferenças: 

e Testes post hoc examinam potenciais diferenças 
estatísticas entre todas as possíveis combinações de 
médias de grupos; testes post hoc têm poder limitado 
e, por isso, são mais adequados para identificar 
grandes efeitos 
Comparações planejadas são adequadas quando 
motivos teóricos a priori sugerem que certos grupos 
diferem de um outro ou mesmo dos demais; erro 
Tipo I aumenta quando o número de comparações 
planejadas sobe 
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(Continuação) 
HBAT. Para tratar dessas preocupações, três questões 
foram colocadas: 


1. Quais diferenças estão presentes em satisfação de 
clientela e outros resultados de compra entre os 
dois canais no sistema de distribuição? 

2. A HBAT está estabelecendo relações melhores com 
seus clientes ao longo do tempo, como refletida na sa- 
tisfação da clientela e outros resultados de compras? 

3. Qual é o entrosamento entre o sistema de distribui- 
ção e essas relações com clientes em termos de re- 
sultados de compras? 


Com as questões de pesquisa definidas, o pesquisador 
agora volta sua atenção para definir variáveis dependen- 
tes e independentes e as correspondentes exigências sobre 
tamanho de amostra. 


Para examinar essas questões, pesquisadores decidiram 
empregar MANOVA para examinar o efeito de X, (Sis- 
tema de distribuição) e X, (Tipo de cliente) sobre três 
medidas de Resultado de compra (X,,, Satisfação; X,,, 
Probabilidade de recomendar HBAT; e X,,, Probabili- 
dade de futura compra). Apesar de uma amostra de 100 
observações ser suficiente para qualquer das análises 
sobre as variáveis individuais, ela não seria apropriada 
para abordá-las em combinação. Um cálculo rápido de 
tamanhos de grupos para essa análise de dois fatores 
(ver Tabela 6-4) identificou pelo menos um grupo com 
menos de 10 observações e outros com menos de 20. 

Como tais tamanhos de grupos não viabilizam a ha- 
bilidade para detectar tamanhos de efeitos médios ou 
pequenos com um nível desejado de poder estatístico 
(ver Tabela 6-2*), uma decisão foi tomada para reunir 
respostas adicionais para complementar as 100 obser- 
vações já disponíveis. Um segundo esforço de pesquisa 
acrescentou mais 100 observações para uma amostra que 
agora tem 200. Este novo conjunto de dados se chama 
HBAT200 e será usado para a análise MANOVA que 
segue adiante. Análises preliminares indicaram que o 
conjunto complementado de dados tinha as mesmas ca- 
racterísticas da HBAT, eliminando assim a necessidade 
de exame adicional deste novo conjunto de dados para 
determinar suas propriedades básicas. 


EXEMPLO 1: DIFERENÇA ENTRE 
DOIS GRUPOS INDEPENDENTES 


Para introduzir os benefícios práticos de uma análise 
multivariada de diferenças de grupos, começamos nossa 


*N. de R.T.: A frase correta seria ver “Tabela 6-3”. 


discussão com um dos planejamentos mais conhecidos: o 
planejamento de dois grupos, no qual cada respondente é 
classificado com base nos níveis (grupos) do tratamento 
(variável independente). Se essa análise estivesse sendo 
executada em um ambiente experimental, respondentes 
seriam aleatoriamente designados a grupos (p.ex., depen- 
dendo se eles assistem um anúncio ou qual tipo de cereal 
que experimentam). Muitas vezes, porém, os grupos são 
formados não por designação ao acaso, mas com base em 
alguma característica do respondente (p.ex., idade, sexo, 
ocupação etc.). 

Em muitos contextos de pesquisa, no entanto, não é 
realista assumir que uma diferença entre dois grupos ex- 
perimentais quaisquer será manifestada em apenas uma 
variável dependente. Por exemplo, dois anúncios podem 
não apenas produzir diferentes níveis de intenção de 
compra, mas também podem afetar diversos outros (po- 
tencialmente correlacionados) aspectos da resposta ao 
anúncio (p.ex., avaliação geral do produto, credibilidade 
do anúncio, interesse, atenção). 

Muitos pesquisadores lidam com esta situação de múl- 
tiplos critérios com repetida aplicação de testes t univaria- 
dos até que todas as variáveis dependentes tenham sido 
analisadas. No entanto, esta abordagem têm sérios pro- 
blemas: 


e Inflação na taxa de erro Tipo I sobre testes t múltiplos 

e Incapacidade de pares de testes t detectarem diferenças 
entre combinações das variáveis dependentes invisíveis em 
testes univariados 


Para superar esses problemas, MANOVA pode ser 
empregada para controlar a taxa de erro geral do Tipo 
I, ao mesmo tempo que ainda fornece uma maneira de 
avaliar as diferenças em cada variável dependente tanto 
coletiva quanto individualmente. 


Estágio 1: Objetivos da análise 


O primeiro passo envolve a identificação das variáveis 
dependentes e independentes adequadas. Como ante- 
riormente discutido, a HBAT identificou o sistema de 
distribuição como um elemento chave em sua estratégia 
de relação com cliente e precisa primeiramente com- 
preender o impacto do sistema de distribuição sobre os 
clientes. 


Questão de pesquisa. A HBAT está comprometida 
com o fortalecimento de sua estratégia de relaciona- 
mento com clientela, com um aspecto focalizado sobre o 
sistema de distribuição. Surge a preocupação com as di- 
ferenças devido a sistema de canais de distribuição (X.), 
que é composto de dois canais (direto através da equipe 
de venda da HBAT, ou indireto via corretor). Três resul- 
tados de compra (X,,, Satisfação; X,,, Probabilidade de 


(Continua) 


336 Análise Multivariada de Dados 


TABELA 6-4 Tamanhos de grupos para uma análise de dois fatores usando os dados da 


HBAT (100 observações) 
X; Sistema de distribuição 
Indireto via corretor Direto ao cliente Total 
X, Menos de 1 ano 23 9 32 
Cliente De 1a5anos 16 19 35 
Tipo Mais de 5 anos 18 15 33 
Total 57 43 100 


(Continuação) 


recomendação da HBAT; e X,,, Probabilidade de futura 
compra) foram identificados como as questões mais im- 
portantes na avaliação dos impactos dos dois sistemas de 
distribuição. A tarefa é identificar se existem diferenças 
entre esses dois sistemas ao longo de todos os resultados 
de compra ou de um subconjunto destes. 


Exame de perfis de grupos. A Tabela 6-5 fornece um 
resumo dos perfis de grupos sobre cada resultado de 
compra ao longo dos dois grupos (sistema de distribui- 
ção direto versus indireto). Uma inspeção visual revela 
que o canal de distribuição direta apresenta os maiores 
escores médios para cada resultado de compra. A tarefa 
de MANOVA é examinar essas diferenças e avaliar a 
extensão em que as mesmas são significantemente dife- 
rentes, tanto coletiva quanto individualmente. 


Estágio 2: Projeto de pesquisa em MANOVA 


A principal consideração no delineamento da MANOVA 
de dois grupos é o tamanho amostral em cada célula, o 
que afeta diretamente o poder estatístico. Como é o caso 
na maioria das pesquisas, os tamanhos das células são 
desiguais, tornando os testes estatísticos mais sensíveis a 
violações das suposições, especialmente o teste para ho- 
mogeneidade de variância da variável dependente. Am- 
bos os problemas devem ser considerados na avaliação do 
planejamento de pesquisa usando X.. 


Como anteriormente discutido, a preocupação com ta- 
manhos amostrais adequados em toda a análise MANO- 
VA resultou no acréscimo de 100 casos adicionais aos 
dados originais de HBAT (ver Tabela 6-4). Com base 
neste conjunto de dados maior, 108 firmas usaram o sis- 
tema indireto de corretores e 92 respondentes utilizaram 
o sistema direto da HBAT. 

Esses tamanhos de grupos oferecem poder estatístico 
mais do que adequado a uma probabilidade de 80% de 
detectar tamanhos médios de efeitos, e quase alcançam 
os níveis necessários para identificação de pequenos ta- 
manhos de efeitos (ver Tabela 6-3). O resultado é um 
planejamento de pesquisa com tamanhos de grupos re- 
lativamente equilibrados e poder estatístico suficiente 
para identificar diferenças em qualquer nível significati- 
vo em termos gerenciais. 


Estágio 3: Suposições em MANOVA 


As premissas mais críticas relativas a MANOVA são a 
independência de observações, homocedasticidade nos 
grupos, e normalidade. Cada uma dessas suposições é 
abordada em relação a cada um dos resultados de com- 
pra. Preocupa também a presença de observações atípicas 
e sua potencial influência sobre as médias de grupos para 
as variáveis de resultado de compra. 


*N. de R.T.: A frase correta seria “ver Tabela 6-5”. 


TABELA 6-5 Estatísticas descritivas de medidas de resultado de compra (X,,, X»y € X,,) para grupos de X, (Sistema de distribuição) 


X; Sistema de distribuição Média Desvio padrão N 
Xo Satisfação Indireto via corretor 6,925 1,033 108 
Direto ao cliente 7,688 1,049 92 
Total 6,952 1,241 200 
Xo Probabilidade de recomendar Indireto via corretor 6,488 0,986 108 
Direto ao cliente 7,498 0,930 92 
Total 6,953 1,083 200 
X Probabilidade de compra Indireto via corretor 7,336 0,880 108 
Direto ao cliente 8,051 0,745 92 
Total 7,665 0,893 200 
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Independência de observações. A independência dos 
respondentes foi garantida tanto quanto possível pelo 
plano de amostragem aleatória. Se o estudo tivesse sido 
feito em um ambiente experimental, a designação ao 
acaso de indivíduos teria garantido a necessária inde- 
pendência de observações. 


Homocedasticidade. Uma segunda suposição crítica se 
refere à homogeneidade das matrizes de variância-cova- 
riância entre os dois grupos. A primeira análise avalia a 
homogeneidade univariada de variância nos dois grupos. 
Como se vê na Tabela 6-6, testes univariados (teste de 
Levene) para todas as três variáveis são não-significantes 
(ou seja, significância maior que 0,05). O próximo passo é 
avaliar coletivamente as variáveis dependentes testando 
a igualdade das matrizes de variância-covariância entre 
os grupos. Novamente, na Tabela 6-6, o teste M de Box 
para igualdade das matrizes de covariância mostra um 
valor não-significante (0,607), indicando nenhuma dife- 
rença significante entre os dois grupos nas três variáveis 
dependentes como um todo. Assim, a suposição de ho- 
mocedasticidade é atendida para cada variável individual 
separadamente e para as três coletivamente. 


Correlação e normalidade de variáveis dependen- 
tes. Outro teste deve ser feito para determinar se as 
medidas dependentes são significativamente correlacio- 
nadas. O teste mais empregado para esta finalidade é o 
teste de esfericidade de Bartlett. Ele examina as corre- 
lações entre todas as variáveis dependentes e avalia se, 


coletivamente, existe inter-correlação significante. Em 
nosso exemplo, há um grau significante de inter-correla- 
ção (significância = 0,000) (ver Tabela 6-6). 

A suposição de normalidade para as variáveis de- 
pendentes (X,,, Xp € X,;) foi examinada no Capítulo 2 
e tida como aceitável. Isso apóia os resultados de teste 
de igualdade das matrizes de variância-covariância entre 
grupos. 


Observações atípicas. A última questão a ser levantada 
é a presença de observações atípicas. Um método simples 
que identifica pontos extremos para cada grupo é o uso de 
gráficos de caixas (ver Figura 6-6). Examinando-se o grá- 
fico de caixas para cada medida dependente, percebem-se 
poucos, se existirem, pontos extremos nos grupos. Nenhum 
ponto extremo para X,,, um para X,, (observação 38*) e 
quatro para X,, (observações 22, 38, 74 e 187). Quando es- 
tudamos tais pontos extremos nas três medidas dependen- 
tes, nenhuma observação foi um valor extremo sobre todas 
as três medidas, e nenhuma observação tem valor tão ex- 
tremado a ponto de justificar exclusão. Logo, todas as 200 
observações serão mantidas para análise posterior. 


Estágio 4: Estimação do modelo 
MANOVA e avaliação do ajuste geral 


O próximo passo é avaliar se os dois grupos exibem di- 
ferenças estatisticamente significantes para as três variá- 


*N. de R.T.: A frase correta seria “... uma para X ,, (observação 86) 
e dois para X,, (observações 86 e 187). 


TABELA 6-6 Medidas multivariadas e univariadas para teste de homocedasticidade de X, 


Teste multivariado de homocedasticidade 


Teste de igualdade de matrizes de covariância de Box 


M de Box 


df? 265275,824 


Sig. 


Testes univariados de homocedasticidade 


Teste de igualdade de variâncias de erro de Levene 


Variável dependente F dft df2 Sig. 
Xi, Satisfação 0,001 1 198 0,978 
Xo Probabilidade de recomendar 0,643 1 198 0,424 
X, Probabilidade de compra 2,832 1 198 0,094 


Teste para correlação entre as variáveis dependentes 


Teste de esfericidade de Bartlett 


Razão de probabilidade 


Qui-quadrado aproximado 260,055 
5 


df 
Sig. 
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FIGURA 6-6 Gráficos de caixas de medidas de resultados de compra (X,, Xo € X54) para grupos de X, (Sistema de distribuição). 


veis de resultado de compra, primeiro coletivamente e 
em seguida individualmente. Para conduzir o teste, antes 
de mais nada especificamos a taxa máxima de erro Tipo I 
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permitida. Fazendo isso, aceitamos que 5 vezes em cada 


100 podemos concluir que o tipo de canal de distribuição 
tem um impacto sobre as variáveis de resultado de com- 
pra quando de fato não tem. 
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Teste estatístico multivariado e análise de poder 
Uma vez estabelecida a taxa aceitável de erro Tipo I, pri- 
meiramente usamos os testes multivariados para avaliar 
o conjunto de variáveis dependentes quanto a diferenças 
entre os dois grupos, e então promovemos testes univaria- 
dos sobre cada resultado de compra. Por fim, os níveis de 
poder são avaliados. 


Testes estatísticos multivariados. A Tabela 6-7 contém 
os quatro testes multivariados mais comumente usados 
(critério de Pillai, lambda de Wilks, traço de Hotelling 
e maior raiz de Roy). Cada uma das quatro medidas in- 
dica que o conjunto de resultados de compra tem uma 
elevada diferença significante (0,000) entre os dois tipos 
de canal de distribuição. Isso confirma as diferenças de 
grupos percebidas na Tabela 6-5 e o gráfico de caixas da 
Figura 6-6. 


Testes estatísticos univariados. Apesar de podermos 
mostrar que o conjunto de resultados de compra difere 
nos grupos, precisamos também examinar cada resulta- 
do de compra individualmente em busca de diferenças 
nos dois tipos de canal de distribuição. A Tabela 6-7 con- 
tém também os testes univariados para cada resultado de 
compra. Como podemos ver, todos os testes individuais 
apresentam igualmente elevada significância (0,000), o 
que indica que cada variável também segue o mesmo pa- 
drão de maiores resultados de compra daqueles servidos 
pelo sistema de distribuição direta. 


Poder estatístico. O poder para os testes estatísticos foi 
1,0, o que indica que os tamanhos amostrais e o tama- 
nho de efeito foram suficientes para garantir que as dife- 


renças significantes seriam detectadas se eles existissem 
além das diferenças devido a erro amostral. 


Estágio 5: Interpretação dos resultados 


A presença de apenas dois grupos elimina a necessidade 
de qualquer tipo de teste post hoc. A significância estatís- 
tica dos testes multivariados e univariados indicando dife- 
renças de grupos na variável estatística dependente (vetor 
de médias) e nos resultados individuais de compras con- 
duz o pesquisador a um exame dos resultados para avaliar 
sua consistência lógica. 


Como anteriormente notado, firmas usando o tipo dire- 
to de distribuição marcaram uma pontuação considera- 
velmente maior do que aquelas atendidas por meio do 
canal de distribuição indireta baseado em corretores. 
As médias de grupos mostradas na Tabela 6-5, basea- 
das em respostas a uma escala de 10 pontos, indicam 
que os clientes usando o canal de distribuição direta 
estão mais satisfeitos (+1,36), com maior disposição 
de recomendar a HBAT (+1,01) e de comprar no fu- 
turo (+0,72). Tais diferenças são refletidas também nos 
gráficos de caixas para os três resultados de compra na 
Figura 6-6. 


Esses resultados confirmam que o tipo de canal de dis- 
tribuição afeta as percepções de clientes em termos dos 
três resultados de compra. Tais diferenças estatisticamen- 
te significantes, que são de magnitude suficiente para tam- 
bém denotar significância gerencial, mostram que o canal 
de distribuição direta é mais efetivo na criação de percep- 


TABELA 6-7 Testes multivariados e univariados para diferenças de grupos em medidas de resultado de compra (X,,, Xyy € X) em 


grupos de X; (Sistema de distribuição) 


Testes multivariados 


Hipóteses 
Teste estatístico Valor F df df de erro Sig. q Poder observado” 
Critério de Pillai 0,307 28,923 3 196 0,000 0,307 1,00 
Lambda de Wilks 0,693 28,923 3 196 0,000 0,307 1,00 
Traço de Hotelling 0,443 28,923 3 196 0,000 0,307 1,00 
Maior raiz de Roy 0,443 28,923 3 196 0,000 0,307 1,00 
àComputado usando alfa = 0,05 
Testes univariados (efeitos entre sujeitos) 
Soma de Quadrado 

Variável dependente quadrados df médio F Sig. q Poder observado” 
X, Satisfação 92,300º 1 92,300 85,304 0,000 0,301 1,00 
Xo Probabilidade de recomendar 50,665º 1 50,665 54,910 0,000 0,217 1,00 
X, Probabilidade de compra 25,396" 1 25,396 37,700 0,000 0,160 1,00 


*Computado usando alfa = 0,05 

ºRÊ = 0,301 (Rº ajustado = 0,298) 
“PR? = 0,217 (Rº ajustado = 0,213) 
“Rê = 0,160 (Rº ajustado = 0,156) 
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ções positivas por parte da clientela em uma grande gama 
de resultados de compras. 


EXEMPLO 2: DIFERENÇA ENTRE 
K GRUPOS INDEPENDENTES 


O planejamento de dois grupos (exemplo 1) é um caso 
especial do delineamento mais geral de k grupos. No caso 
mais abrangente, cada respondente é um membro ou é 
aleatoriamente designado a um dos k níveis (grupos) do 
tratamento (variável independente). Em um caso univa- 
riado, uma única variável dependente métrica é medida, e 
a hipótese nula é que todas as médias de grupos são iguais 
(Le., 1, = 1, = 4; =... = 1). No caso multivariado, múl- 
tiplas variáveis dependentes métricas são medidas, e a hi- 
pótese nula é a de que todos os vetores de escores médios 
de grupo são iguais (i.e.,v, = V; = V; =... V,), onde v se 
refere a um vetor ou conjunto de escores médios. 

Em planejamentos de k grupos nos quais múltiplas va- 
riáveis dependentes são medidas, muitos pesquisadores 
prosseguem com uma série de testes F individuais (ANO- 
VAs) até que todas as variáveis dependentes tenham sido 
analisadas. Como o leitor deve suspeitar, esta abordagem 
sofre das mesmas deficiências de uma série de testes t ao 
longo de múltiplas variáveis dependentes; ou seja, uma sé- 
rie de testes Fcom ANOVA: 


e Resulta em uma taxa inflacionada de erro Tipo 1 

e Ignora a possibilidade de que alguma composição das variá- 
veis dependentes possa fornecer alguma evidência confiável 
de diferenças gerais de grupos 


Além disso, como testes F individuais ignoram corre- 
lações entre as variáveis independentes, eles usam menos 
do que o total de informação disponível para a avaliação 
de diferenças gerais de grupos. 

MANOVA novamente fornece uma solução para esses 
problemas. MANOVA resolve o problema da taxa de erro 
do Tipo I oferecendo um único teste geral de diferenças de 
grupos em um nível q especificado. Ela resolve o proble- 
ma da variável composta via formação implícita e teste das 
combinações lineares das variáveis dependentes que forne- 
cem a mais forte evidência de diferenças gerais de grupos. 


Estágio 1: Objetivos de MANOVA 


No exemplo anterior, a HBAT avaliou seu desempenho 
entre clientes com base nos dois canais de sistema de dis- 
tribuição (X.) empregados. MANOVA foi utilizada devi- 
do à vontade de examinar um conjunto de três variáveis 
de resultado de compra representando o desempenho da 
HBAT. Um segundo objetivo de pesquisa foi determinar 
se as três variáveis de resultado de compra foram afetadas 
pela extensão de sua relação com a HBAT (X,). A hipóte- 
se nula que a HBAT deseja agora testar é a de que os três 
vetores amostrais de escores médios (um vetor para cada 
categoria de relação com cliente) são equivalentes. 


Questões de pesquisa. Além de examinar o papel do 
sistema de distribuição, a HBAT também manifestou 
um desejo de avaliar se as diferenças nos resultados de 
compra são atribuíveis apenas ao tipo de canal de dis- 
tribuição ou se outros fatores não-métricos podem ser 
identificados como mostrando diferenças significantes 
também. A HBAT especificamente selecionou X, (Tipo 
de cliente) para determinar se a extensão da relação da 
HBAT com o cliente tem algum impacto sobre esses re- 
sultados de compra. 


Exame de perfis de grupos. Como pode ser percebido 
na Tabela 6-8, os escores médios de todas as três variá- 
veis de resultado de compra aumentam quando a exten- 
são da relação com a clientela cresce. A questão a ser 
tratada nesta análise é a magnitude em que essas dife- 
renças como um todo podem ser consideradas estatis- 
ticamente significantes e se tais diferenças se estendem 
a cada diferença entre grupos. Em uma segunda análise 
MANOVA, X, (Tipo de cliente) é examinada quanto a 
diferenças em resultados de compra. 


Estágio 2: Projeto de pesquisa em MANOVA 


Como foi a situação na análise anterior de dois grupos, ta- 
manho amostral do grupo é uma consideração prioritária 
em planejamento de pesquisa. Mesmo quando todos os 
casos de tamanhos de grupos excedem de longe o mínimo 
necessário, o pesquisador sempre deve estar comprometi- 
do em atingir o poder estatístico exigido para a questão de 
pesquisa em mãos. 


A análise do impacto de X, agora demanda que anali- 
semos os tamanhos amostrais para os três grupos de ex- 
tensão de relação com clientela (menos de 1 ano, de 1 
a 5 anos, e mais de 5 anos). Na amostra HBAT, os 200 
respondentes são quase igualmente divididos nos três 
grupos com amostras de 68, 64 e 68 (ver Tabela 6-8). Os 
tamanhos amostrais ainda fornecem poder estatístico su- 
ficiente para identificar tamanhos de efeitos médios ou 
grandes (olhar Tabela 6-3), enquanto ainda estão aquém 
dos tamanhos necessários para identificação de pequenos 
tamanhos de efeitos com um poder de 0,80. Assim, quais- 
quer resultados não-significantes devem ser examinados 
de perto para se avaliar se o tamanho de efeito tem signi- 
ficância gerencial, pois o baixo poder estatístico impede 
de designá-los como estatisticamente significantes. 


Estágio 3: Suposições em MANOVA 


Uma vez que já foram examinadas as questões de nor- 
malidade (ver Capítulo 2) e de inter-correlação (teste 
de esfericidade de Bartlett na Tabela 6-6) das variáveis 
dependentes no exemplo anterior, a única preocupação 
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TABELA 6-8 Estatísticas descritivas de medidas de resultado de compra (X, Xo € X»:) para grupos de X, (Tipo de cliente) 


X, Tipo de cliente Média Desvio padrão N 

Xo Satisfação Menos de 1 ano 5,729 0,764 68 
De 1abanos 7,294 0,708 64 

Mais de 5 anos 7,853 1,033 68 

Total 6,952 1,241 200 

Xo Probabilidade de recomendar Menos de 1 ano 6,141 0,995 68 
De 1abanos 7,209 0,714 64 

Mais de 5 anos 7,522 0,976 68 

Total 6,953 1,083 200 

X Probabilidade de comprar Menos de 1 ano 6,962 0,760 68 
De 1abanos 7,883 0,643 64 

Mais de 5 anos 8,163 0,777 68 

Total 7,665 0,893 200 


remanescente repousa na homocedasticidade dos resul- 
tados de compra nos grupos formados por X, e na iden- 
tificação de observações atípicas. Primeiro, examinamos 
essa homocedasticidade no nível multivariado (todas as 
três variáveis de resultado de compra coletivamente), e 
em seguida para cada variável dependente em separado. 
O teste multivariado para homogeneidade de variância 
dos três resultados de compra é realizado com o teste M 
de Box, enquanto o teste de Levene é empregado para 
avaliar cada variável de resultado de compra individual- 
mente. 


Homocedasticidade. A Tabela 6-9 contém os resul- 
tados dos testes multivariado e univariado de homoce- 
dasticidade. O teste M de Box indica ausência de hete- 
roscedasticidade (significância = 0,069). Nos testes de 
Levene para igualdade de variâncias de erro, dois dos 
resultados de compra (X,, e X,,) mostraram resultados 
não-significantes e confirmaram homocedasticidade. 
No caso de X,, o nível de significância foi de 0,001, 
indicando a possível existência de heteroscedasticida- 
de para esta variável. No entanto, dados os tamanhos 
amostrais relativamente grandes em cada grupo e a 
presença de homocedasticidade para os outros dois re- 
sultados de compra, ações corretivas não foram neces- 
sárias para X,,. 


Observações atípicas. O exame do gráfico de caixas 
para cada variável de resultado de compra (ver Figura 
6-7) revela um pequeno número de pontos extremos 
para cada medida dependente (observação 184* para 
X,: observações 38*, 104, 119 e 149 para X,,; e obser- 
vações 104 e 187 para X,,). Como foi o caso do exemplo 
anterior envolvendo X,, nenhuma observação demons- 
trou valores extremos em todas as três medidas depen- 


*N.deR.T.: A frase correta seria “(observação 104 para X,,; obser- 
vações 86, 104, 118 e 149 para X,o; ...)”. 


dentes, e também não houve valores tão extremos em 
qualquer dos casos a ponto de visivelmente afetar os 
valores de grupo. Assim, nenhuma observação foi classi- 
ficada como atípica designada para exclusão, e todas as 
200 observações foram empregadas na análise. 


Estágio 4: Estimação do modelo 
MANOVA e avaliação do ajuste geral 


O uso de MANOVA para examinar uma variável inde- 
pendente com três ou mais níveis revela as diferenças 
ao longo dos níveis para as medidas dependentes com 
os testes estatísticos multivariados e univariados ilus- 
trados no exemplo anterior. Em tais situações, os testes 
estatísticos estão avaliando a significância de um efeito 
principal, o que significa que as diferenças entre grupos, 
quando vistas coletivamente, são substanciais o bastan- 
te para serem consideradas estatisticamente significan- 
tes. Deve ser observado que significância estatística do 
efeito principal não garante que cada grupo também seja 
significantemente distinto de cada um dos demais gru- 
pos. Em vez disso, testes separados descritos na próxima 
seção podem examinar quais grupos exibem diferenças 
significantes. 


Todas as três medidas dependentes mostram um padrão 
definido de aumento quando a extensão da relação com 
clientela cresce (ver Tabela 6-8 e Figura 6-7). O primei- 
ro passo é utilizar os teste multivariados e avaliar se o 
conjunto de resultados de compra, no qual cada um de 
seus elementos parece seguir um padrão semelhante de 
aumento à medida que o tempo avança, varia de uma 
maneira estatisticamente significante (isto é, um efeito 
principal significante). A Tabela 6-10 contém os quatro 
testes multivariados mais comumente usados, e, como 
vemos, todos os quatro testes indicam uma diferença es- 


(Continua) 
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TABELA 6-9 Medidas multivariadas e univa 


riadas para testar homocedasticidade de X, 


Teste multivariado de homocedasticidade 


Teste de Box para igualdade de matrizes de covariância 


M de Box 20,383 
F 1,659 
df 12 

df? 186673,631 
Sig. 0,069 


Testes univariados de homocedasticidade 


Teste de Levene para igualdade de variâncias de erro 


Variável dependente F dft df2 Sig. 
X Satisfação 6,871 2 197 0,001 
Xo Probabilidade de recomendar 2,951 2 197 0,055 
X Probabilidade de compra 0,800 2 197 0,451 


(Continuação) 
tatisticamente significante do conjunto coletivo de medi- 
das dependentes nos três grupos. 

Além dos multivariados, testes univariados para 
cada medida dependente apontam que todas as três 
medidas dependentes, quando consideradas individu- 
almente, também apresentam efeitos principais signi- 
ficantes. Logo, tanto coletiva quanto individualmente, 
os três resultados de compra (X,, Xp € X,1) variam em 
um nível estatisticamente significante ao longo dos três 
grupos de X,. 


Estágio 5: Interpretação dos resultados 


A interpretação de uma análise MANOVA com uma va- 
riável independente de três ou mais níveis exige um pro- 
cesso de dois passos: 


e Exame do efeito principal da variável independente (nes- 
te caso, X,) sobre as três medidas dependentes 

e Identificação das diferenças entre grupos individuais para 
cada uma das medidas dependentes com comparações 
planejadas ou testes post hoc 


A primeira análise examina as diferenças gerais nos 


níveis para as medidas dependentes, enquanto a segun- 


TABELA 6-10 Testes multivariados e univariados para diferenças de grupos em medidas de resultado de compra (X, Xo € X>) nos 


grupos de X, (Tipo de cliente) 


Testes multivariados 


Teste estatístico Valor F df dehipótese dfde erro Sig. q Poder observado” 
Critério de Pillai 0,543 24,368 6 392 0,000 0,272 1,000 
Lambda de Wilks 0,457 31,103 6 390 0,000 0,324 1,000 
Traço de Hotelling 1,184 38,292 6 388 0,000 0,372 1,000 
Maior raiz de Roy 1,183 77,280 3 196 0,000 0,542 1,000 
*Computado usando alfa = 0,05 
Testes univariados (efeitos entre sujeitos) 
Soma de 
quadrados Quadrado 

Variável dependente Tipo III df médio F Sig. Poder observado” 
Xo Satisfação 164,311º 2 82,156 113,794 0,000 0,536 1,00 
Xo Probabilidade de recomendar 71,043 2 35,521 43,112 0,000 0,304 1,00 
X Probabilidade de compra 53,545º 2 26,773 50,121 0,000 0,337 1,00 


*Computado usando alfa = 0,05 

ºP? = 0,536 (Rº ajustado = 0,531) 
“FÊ = 0,304 (Rº ajustado = 0,297) 
“PÊ = 0,337 (FÊ ajustado = 0,331) 
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FIGURA 6-7 Gráficos de caixas de medidas de resultados de compras (X,,, X € X,4) para grupos de X, (Tipo de cliente). 


343 


344 Análise Multivariada de Dados 


da análise avalia as diferenças entre grupos individuais 
(p.ex., grupos 1 e 2, grupos 2 e 3, grupos 1 e 3 etc.) para 
identificar aquelas comparações de grupos com diferenças 
significantes. 


Avaliação do efeito principal de X,. Todos os testes 
multivariados e univariados indicaram um efeito princi- 
pal significante de X, (Tipo de cliente) sobre cada variá- 
vel dependente individual bem como o conjunto das va- 
riáveis dependentes quando consideradas coletivamente. 
O efeito principal significante corresponde a dizer que 
as variáveis dependentes variam bastante entre os três 
grupos de clientes com base na extensão da relação com 
clientela. Como podemos ver na Tabela 6-8 e na Figu- 
ra 6-7, o padrão de compras aumenta em cada medida 
dependente quando a relação com clientela amadurece. 
Por exemplo, satisfação do cliente (X,,) é menor (5,729) 
para aqueles com menos de 1 ano de relação, aumen- 
tando (7,294) para aqueles clientes entre 1 e 5 anos, até 
alcançar o mais alto nível (7,853) para aqueles que se 
relacionam há mais de 5 anos. Padrões semelhantes são 
vistos para as outras duas medidas dependentes. 


Realização de comparações post hoc 

Como já observado, um efeito principal significante indica 
que o conjunto total de diferenças de grupos (p.ex., gru- 
pos 1 e 2 etc.) é de elementos que são grandes o bastante 
para serem considerados estatisticamente significantes. 
Também deve ser notado que um efeito principal signifi- 
cante não garante que todas as diferenças de grupos sejam 
igualmente significantes. Podemos descobrir que um efei- 
to principal significante é na verdade devido a uma úni- 
ca diferença de grupos (p.ex., grupos 1 e 2), enquanto as 
outras comparações (grupos 1 e 3 e grupos 2 e 3) não são 
significativamente diferentes. 

A questão passa a ser a seguinte: como essas diferenças 
individuais de grupos são avaliadas enquanto se mantém 
um nível aceitável de taxa geral de erro do Tipo 1? Este 
mesmo problema é encontrado quando se consideram 
múltiplas medidas dependentes, mas neste caso fazendo- 
se comparações para uma única variável dependente ao 
longo de múltiplos grupos. Esse tipo de questão pode ser 
testada com um dos procedimentos a priori. Se o contras- 
te é usado, uma comparação específica é feita entre dois 
grupos (ou conjuntos de grupos) para ver se eles são signi- 
ficativamente diferentes. Outra abordagem é usar um dos 
procedimentos post hoc que testa todas as diferenças de 
grupos e então identifica aquelas que são estatisticamente 
significantes. 


A Tabela 6-11 contém três métodos de comparação post 
hoc (HSD de Tukey, Scheffé e LSD) aplicados em to- 
dos os três resultados de compra nos três grupos de X,. 
Quando examinamos X,, (Satisfação), primeiro perce- 


bemos que apesar de o efeito principal geral ser signi- 
ficante, as diferenças entre grupos adjacentes não são 
constantes. A diferença entre clientes de menos de 1 ano 
e aqueles entre 1 e 5 anos é de —1,564 (o sinal negativo 
indica que os clientes com menos de 1 ano têm o menor 
valor). Quando examinamos a diferença de grupos en- 
tre clientes de 1 a 5 anos e aqueles com mais de 5 anos, 
porém, a diferença é reduzida para —0,559 (aproximada- 
mente um terço da diferença anterior). 

Desse modo, o pesquisador está interessado em saber 
se ambas as diferenças são significantes, ou se há signi- 
ficância apenas entre os dois primeiros grupos. Quando 
olhamos para as últimas três colunas da Tabela 6-11, po- 
demos ver que todas as diferenças separadas de grupos 
para X, são significantes, o que aponta para o fato de 
que a diferença de —0,559, apesar de ser muito menor do 
que a outra, ainda é estatisticamente significante. 

Quando examinamos as comparações para os outros 
dois resultados de compra (X,, e X,,), surge um outro pa- 
drão. Novamente, as diferenças entre os dois primeiros 
grupos (menos de 1 ano e entre 1 e 5 anos) são todas esta- 
tisticamente significantes em todos os três testes post hoc. 
No entanto, quando examinamos a próxima comparação 
(clientes de 1 a 5 anos versus aqueles com mais de 5 anos 
como clientes), dois dos três testes indicam que os dois 
grupos não são distintos. Em tais testes, os resultados de 
compra de X,, e X,, para clientes de 1 a 5 anos não são 
significativamente distintos daqueles com mais de 5 anos. 
Este resultado é contrário àquilo que foi descoberto para 
satisfação, na qual esta diferença era significante. 


Quando a variável independente tem três ou mais ní- 
veis, o pesquisador deve se empenhar neste segundo nível 
de análise além da avaliação de efeitos principais signifi- 
cantes. Aqui o pesquisador não está interessado no efei- 
to coletivo da variável independente, mas nas diferenças 
entre grupos específicos. As ferramentas de comparações 
planejadas ou métodos post hoc fornecem uma maneira 
poderosa de se fazerem estes testes de diferenças de grupos 
enquanto também mantêm a taxa geral de erro Tipo 1. 


EXEMPLO 3: UM DELINEAMENTO 
FATORIAL PARA MANOVA COM 
DUAS VARIAVEIS INDEPENDENTES 


Nos dois exemplos anteriores, as análises MANOVA fo- 
ram extensões de análises univariadas de dois e três gru- 
pos. Neste exemplo, exploramos um experimento fatorial 
multivariado: duas variáveis independentes usadas como 
tratamentos para analisar diferenças do conjunto de va- 
riáveis dependentes. No curso de nossa discussão, ava- 
liamos os efeitos interativos ou conjuntos entre os dois 
tratamentos sobre variáveis dependentes separada e co- 
letivamente. 
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TABELA 6-11 Comparações post hoc para diferenças individuais de grupos em medidas de resultado de compra (X, Xo € X54) nos 
grupos de X, (Tipo de cliente) 
Diferença média entre Significância estatística de 
Grupos a serem comparados grupos (l- J) comparação post hoc 
Diferença HSD de 

Variável dependente Grupo | Grupo J média Erro padrão Tukey Scheffé LSD 
X,o Satisfação 

Menos def ano De1ab5anos —1,564 0,148 0,000 0,000 0,000 

Menos de 1 ano | Mais de 5 anos -2,124 0,146 0,000 0,000 0,000 

De 1a5anos Mais de 5 anos —0,559 0,148 0,000 0,001 0,000 
X Probabilidade de recomendar 

Menos def ano De1ab5anos —1,068 0,158 0,000 0,000 0,000 

Menos de 1 ano | Mais de 5 anos —1,381 0,156 0,000 0,000 0,000 

De 1a5anos Mais de 5 anos —- 0,313 0,158 0,118 0,144 0,049 
X, Probabilidade de comprar 

Menos def ano De1a5anos — 0,921 0,127 0,000 0,000 0,000 

Menos de 1 ano | Mais de 5 anos —1,201 0,125 0,000 0,000 0,000 

De 1a5 anos Mais de 5 anos — 0,280 0,127 0,071 0,091 0,029 


Estágio 1: Objetivos de MANOVA 


Nas questões de pesquisa multivariadas prévias, a HBAT 
considerou o efeito de apenas uma variável de tratamento 
sobre as variáveis dependentes. Aqui, a possibilidade de 
efeitos conjuntos entre duas ou mais variáveis indepen- 
dentes deve ser igualmente considerada. Deste modo, a 
interação entre as variáveis independentes pode ser ava- 
liada com seus efeitos principais. 


Questões de pesquisa. As duas primeiras questões de 
pesquisa que examinamos se referem ao impacto de 
dois fatores — sistema de distribuição e duração da re- 
lação com clientes — sobre um conjunto de resultados 
de compra. Em cada caso, os fatores foram mostrados 
como tendo impactos significantes (isto é, resultados de 
compra mais favoráveis para firmas no sistema direto de 
distribuição ou aquelas com fidelidade mais duradoura 
como cliente da HBAT). 

Há ainda uma terceira questão não resolvida: como 
esses dois fatores operam quando considerados simul- 
taneamente? Estamos aqui interessados em saber 
como as diferenças entre sistemas de distribuição se 
mantêm nos grupos com base na duração da relação 
com a HBAT. Vimos que clientes no sistema direto 
de distribuição tinham resultados de compra signifi- 
cativamente maiores (maior satisfação etc.), mas tais 
diferenças estão sempre presentes para cada grupo de 
clientes com base em X,? O que segue adiante é ape- 
nas uma amostra dos tipos de questão que podemos 
levantar quando se consideram as duas variáveis jun- 


Os dois sistemas de distribuição mostram diferenças 
para clientes com 5 anos ou mais? 

O sistema de distribuição direta é sempre preferencial 
em relação ao indireto nos grupos de clientela de X,? 


Combinando ambas as variáveis independentes (X, 
e X,) em um planejamento fatorial, criamos seis grupos 
de clientes: os três grupos baseados em duração de suas 
relações com a HBAT separados naqueles grupos em 
cada sistema de distribuição. Conhecidos como um pla- 
nejamento 3 x 2, os três níveis de X, separados para cada 
nível de X, formam um grupo separado para cada tipo 
de cliente dentro de cada canal de distribuição. 


Exames de perfis de grupos. A Tabela 6-12 fornece um 
perfil de cada grupo para o conjunto de resultados de 
compra. Muitas vezes, uma perspectiva mais simples é 
através de uma representação gráfica. Uma opção é for- 
mar um gráfico de linhas, e ilustramos isso quando ve- 
mos os termos de interação em uma seção adiante. Po- 
demos utilizar também gráficos de caixas para mostrar 
não apenas as diferenças entre médias de grupos, mas 
a superposição do domínio de valores em cada grupo. 
A Figura 6-8 ilustra tal gráfico para X,, (Satisfação) nos 
seis grupos de nosso planejamento fatorial. Como pode- 
mos perceber, a satisfação aumenta quando o tempo de 
relação com a HBAT cresce, mas as diferenças entre os 
dois sistemas de distribuição não são sempre constantes 
(p.ex., elas parecem mais próximas para clientes de 1 à 
5 anos). 


tas em uma análise: 


e Osistema de distribuição direta é mais efetivo para 
clientes mais novos? 


O objetivo da inclusão de múltiplas variáveis indepen- 


dentes em uma MANOVA é avaliar seus efeitos “con- 
tingentes” ou “controladores” sobre as demais variáveis. 
Neste caso, podemos ver como a duração da relação com 
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FIGURA 6-8 Gráfico de caixas de medida de resultado de compra (X,5) para grupos de X; (Sistema de distribuição) por X, (Tipo de cliente). 


a HBAT muda com mais percepções positivas geralmente 
vistas para o sistema de distribuição direta. 


Estágio 2: Projeto de pesquisa em MANOVA 


Qualquer plano fatorial de duas ou mais variáveis inde- 
pendentes levanta a questão de tamanho de amostra ade- 
quado nos vários grupos. O pesquisador deve garantir, na 
criação do planejamento fatorial, que cada grupo tenha 
tamanho de amostra suficiente para: 


1. Atender às exigências mínimas de que os tamanhos de gru- 
pos excedam o número de variáveis dependentes 

2. Fornecer o poder estatístico para avaliar diferenças conside- 
radas significantes na prática. 


Considerações sobre tamanho de amostra. Como ob- 
servado na seção anterior, esta análise é chamada de 
planejamento 2 x 3 por incluir dois níveis de X, (distri- 
buição direta versus indireta) e três níveis de X, (menos 
de 1 ano, de 1 a 5 anos e mais de 5 anos). O problema de 
tamanho amostral por grupo foi de tamanha preocupa- 
ção para os pesquisadores da HBAT que o levantamento 
original da HBAT de 100 observações foi complemen- 
tado com 100 respondentes adicionais apenas para esta 
análise (ver discussão mais detalhada na seção anterior 
aos exemplos). Mesmo com os respondentes adicionais, 
a amostra de 200 observações deve ser dividida nos seis 
grupos, preferencialmente de uma maneira equilibrada. 

Os tamanhos amostrais por célula são mostrados na 
Tabela 6-12 e podem ser vistos da seguinte maneira sim- 
plificada: 


X, Sistema de distribuição 
X, Tipo de cliente Indireto Direto 
Menos de 1 ano 52 16 
De 1as5anos 25 39 
Mais de 5 anos 31 37 


Adequação de poder estatístico. Os tamanhos amos- 
trais em todas as células, exceto uma, fornecem poder 
estatístico suficiente para identificar pelo menos tama- 
nhos de efeito grandes com uma probabilidade de 80%. 
Contudo, a amostra menor de 16 para clientes com me- 
nos de 1 ano atendidos pelo canal de distribuição direta 
deve preocupar um pouco. Assim, devemos reconhecer 
que, a menos que os tamanhos de efeitos sejam substan- 
ciais, os limitados tamanhos amostrais em cada grupo, 
mesmo desta amostra de 200 observações, podem evitar 
a identificação de diferenças significantes. Esta questão 
se torna especialmente crítica quando se examina uma 
diferença não-significante na qual o pesquisador deve 
determinar se o resultado não-significante é devido a ta- 
manho de efeito insuficiente ou baixo poder estatístico. 


Estágio 3: Suposições em MANOVA 


Como nas análises MANOVA anteriores, a suposição de 
maior importância é a homogeneidade das matrizes de 
variância-covariância nos grupos. Satisfazer tal suposição 
viabiliza interpretação direta dos resultados sem ter que 
considerar tamanhos de grupos, nível de covariâncias no 
grupo e assim por diante. Suposições estatísticas adicio- 
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TABELA 6-12 Estatísticas descritivas de medidas de resultado de compra (X,,, Xo € X»:) para grupos de X, (Tipo de cliente) por X; 


(Sistema de distribuição) 


Variável dependente X,Tipo de cliente 'X,Sistema de distribuição Média Desvio padrão N 

X,o Satisfação Menos de 1 ano Indireto via corretor 5,462 0,499 52 
Direto ao cliente 6,600 0,839 16 

Total 5,729 0,764 68 

De 1a5anos Indireto via corretor 7,120 0,551 25 

Direto ao cliente 7,405 0,779 39 

Total 7,294 0,708 64 

Mais de 5 anos Indireto via corretor 7A32 0,803 31 

Direto ao cliente 8,457 0,792 37 

Total 7,853 1,033 68 

Total Indireto via corretor 6,325 1,033 108 

Direto ao cliente 7,688 1,049 92 

Total 6,952 1,241 200 

Xo Probabilidade de recomendar | Menos de 1 ano Indireto via corretor 5,883 0,773 52 
Direto ao cliente 6,981 1,186 16 

Total 6,141 0,995 68 

De 1a5anos Indireto via corretor 7,144 0,803 25 

Direto ao cliente 7,251 0,659 39 

Total 7,209 0,714 64 

Mais de 5 anos Indireto via corretor 6,974 0,835 31 

Direto ao cliente 7,981 0,847 37 

Total 7,522 0,976 68 

Total Indireto via corretor 6,488 0,986 108 

Direto ao cliente 7,498 0,980 92 

Total 6,953 1,083 200 

X Probabilidade de comprar Menos de 1 ano Indireto via corretor 6,763 0,702 52 
Direto ao cliente 7,606 0,569 16 

Total 6,962 0,760 68 

De 1a5anos Indireto via corretor 7,804 0,710 25 

Direto ao cliente 7,933 0,601 39 

Total 7,883 0,643 64 

Mais de 5 anos Indireto via corretor 7,919 0,648 31 

Direto ao cliente 8,368 0,825 37 

Total 8,163 0,777 68 

Total Indireto via corretor 7,336 0,880 108 

Direto ao cliente 8,051 0,745 92 

Total 7,665 0,893 200 


nais relacionadas às variáveis dependentes (normalidade 
e correlação) já foram abordadas nos exemplos anteriores. 
Uma questão final é a presença de observações atípicas e a 
necessidade de eliminação de quaisquer observações que 
possam distorcer os valores médios de qualquer grupo. 


Homocedasticidade. Para este planejamento fatorial, 
seis grupos estão envolvidos no teste da suposição de ho- 
mocedasticidade (ver Tabela 6-13). O teste multivariado 
(M de Box) tem um valor não-significante (0,153), que 
nos permite aceitar a hipótese nula de homogeneidade 
das matrizes de variância-covariância no nível 0,05. 

Os testes univariados para as três variáveis de resul- 
tado de compra separadamente são também não-signi- 


ficantes. Com os testes multivariados e univariados exi- 
bindo não-significância, o pesquisador pode prosseguir 
sabendo que a suposição de homocedasticidade foi com- 
pletamente atendida. 


Observações atípicas. A segunda questão envolve o 
exame de observações com valores extremos e a pos- 
sível designação de observações como atípicas com 
eliminação da análise. Curiosamente, o exame dos 
gráficos de caixas para os três resultados de compras 
identifica um número menor de observações com valo- 
res extremos do que os encontrados para a própria X,. 
A variável dependente com os valores mais extremos 


é X,, com somente três, enquanto as outras medidas 
(Continua) 
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TABELA 6-13 Medidas multivariadas e univariadas para teste de homocedasticidade nos grupos de X, por X; 


Testes multivariados para homocedasticidade 


Teste de Box de igualdade de matrizes de covariância 


M de Box 39,721 
E 1,263 
df 30 

af? 33214,450 
Sig. 0,153 


Testes univariados de homocedasticidade 


Teste de Levene de igualdade de variâncias de erro 


Variável dependente F dfi df2 Sig. 
Xo Satisfação 2,169 5 194 0,059 
Xo Probabilidade de recomendar 1,808 5 194 0,113 
X Probabilidade de compra 0,990 5 194 0,425 


(Continuação) 
dependentes apresentam um e dois valores extremos. 


Além disso, nenhuma observação tem valores extremos 
em mais de uma medida dependente (X,,, observação 
184; X,, observações 7, 115 e 149; e X,,, observações 
67 e 187). Como resultado, todas as observações foram 
mantidas na análise. 


Estágio 4: Estimação do modelo 
MANOVA e avaliação do ajuste geral 


O modelo MANOVA para um planejamento fatorial 
testa não apenas os efeitos principais de ambas as variá- 
veis independentes, mas também a interação ou efeito 
conjunto das mesmas sobre as variáveis dependentes. 
O primeiro passo é examinar o efeito de interação e de- 
terminar se ele é estatisticamente significante. Se for, o 
pesquisador deve confirmar que o efeito de interação 
é ordinal. Se for desordinal, os testes estatísticos dos 
efeitos principais não são válidos. Assumindo um efeito 
de interação significante ordinal ou não-significante, os 
efeitos principais podem ser interpretados diretamente 
sem ajuste. 


Avaliação do efeito de interação 

Efeitos de interação podem ser identificados gráfica e 
estatisticamente. O meio gráfico mais comum é criar 
representações com linhas que retratam pares de va- 
riáveis independentes. Como ilustrado na Figura 6-5, 
efeitos de interação significantes são representados por 
retas não-paralelas (com as paralelas retratando ausên- 
cia de efeito de interação). Se as retas se afastam de pa- 
ralelismo mas nunca se cruzam de maneira significante, 
então a interação é considerada ordinal. Se as retas se 
cruzam a ponto de que pelo menos em um caso a ordem 
relativa das retas é invertida, a interação é tida como 
desordinal. 


A Figura 6-9 retrata cada variável dependente nos seis 
grupos, indicando pelo padrão de ausência de parale- 
lismo que pode existir uma interação. Como podemos 
ver em cada gráfico, o nível médio de X, (de 1 a 5 anos 
com a HBAT) tem uma diferença substancialmente me- 
nor entre as duas retas (representando os dois canais de 
distribuição) do que os outros dois níveis de X,. Pode- 
mos confirmar esta observação examinando as médias 
de grupo da Tabela 6-12. Usando X,, (Satisfação) como 
um exemplo, percebemos que a diferença entre canais 
de distribuição direta e indireta é de 1,138 para clientes 
com menos de 1 ano, o que é bastante semelhante à di- 
ferença entre canais (1,325) para clientes com mais de 5 
anos. Não obstante, para aqueles atendidos pela HBAT 
no período de 1 a 5 anos, a diferença entre clientes dos 
dois canais é de apenas 0,285. Portanto, as diferenças en- 
tre os dois canais de distribuição, apesar de terem sido 
percebidas como significantes em exemplos anteriores, 
podem ser evidenciadas como diferenciando (interagin- 
do) com base no tempo que o cliente tem sido atendido 
pela HBAT. A interação é considerada ordinal porque 
em todos os casos o canal de distribuição direta tem 
maiores escores de satisfação. 


Teste dos efeitos de interação e dos efeitos principais 
Além da solução gráfica, efeitos de interação também po- 
dem ser testados da mesma maneira que os efeitos princi- 
pais. Logo, o pesquisador pode fazer tanto uma avaliação 
multivariada quanto univariada do efeito de interação com 
os testes estatísticos descritos em exemplos anteriores. 


A Tabela 6-14 contém os resultados de MANOVA para 
testes de efeito de interação e de efeitos principais. O 
teste para um efeito de interação significante procede 
como qualquer outro efeito. Primeiro, os efeitos multi- 
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FIGURA 6-9 Representações gráficas de efeitos de interação de medidas de resultado de compras (X,9, X»o € X»1) Nos grupos de X; (Sistema 
de distribuição) por X, (Tipo de cliente). 
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variados são examinados, e neste caso os quatro testes 
apresentam significância estatística. Em seguida, testes 
univariados para cada variável dependente são execu- 
tados. Novamente, o efeito de interação é considerado 
significante para cada uma das três variáveis dependen- 
tes. Os testes estatísticos confirmam o que foi indicado 
nos gráficos: um efeito de interação ordinal significante 
acontece entre Xe X,. 


pais para suas diferenças nos grupos. Nos casos em que 
um efeito de interação desordinal é descoberto, os efeitos 
principais são perturbados pela interação desordinal e tes- 


tes para diferenças não devem ser realizados. 


Estimação de efeitos principais 


Se o efeito de interação é considerado não-significante ou 
mesmo significante e ordinal, então o pesquisador pode 
proceder para estimar a significância dos efeitos princi- 


Com uma interação ordinal significante, podemos proce- 
der para avaliarmos se ambas as variáveis independentes 
ainda têm efeitos principais significantes quando consi- 
deradas simultaneamente. A Tabela 6-14 também con- 
tém os resultados MANOVA para os efeitos principais 
de X, e X, além dos testes para o efeito de interação já 
discutidos. Como descobrimos ao analisá-las separada- 
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TABELA 6-14 Testes multivariados e univariados para diferenças de grupos em medidas de resultado de compra (X,,, Xo € X»;) Nos grupos 


de X, por X; 


Testes multivariados 


Efeito Teste estatístico Valor F dfde hipótese dífdeerro Sig. q Poder observado” 
X, Critério de Pillai 0,488 20,770 6 386 0,000 0,244 1,000 
Lambda de Wilks 0,512 25,429 6 384 0,000 0,284 1,000 
Traço de Hotelling 0,952 30,306 6 382 0,000 0,322 1,000 
Maior raiz de Roy 0,951 61,211 3 193 0,000 0,488 1,000 
X, Critério de Pillai 0,285 25,500 3 192 0,000 0,285 1,000 
Lambda de Wilks 0,715 25,500 3 192 0,000 0,285 1,000 
Traço de Hotelling 0,398 25,500 3 192 0,000 0,285 1,000 
Maior raiz de Roy 0,398 25,500 3 192 0,000 0,285 1,000 
XXX Critério de Pillai 0,124 4,256 6 386 0,000 0,062 0,980 
Lambda de Wilks 0,878 4,291 6 384 0,000 0,063 0,981 
Traço de Hotelling 0,136 4,327 6 382 0,000 0,064 0,982 
Maior raiz de Roy 0,112 7,194 3 193 0,000 0,101 0,981 
?Computado usando alfa = 0,05 
Testes univariados (efeitos entre sujeitos) 
Soma de Quadrado 
Efeito Variável dependente quadrados df médio F Sig. Poder observado” 
Geral X Satisfação 210,999º 5 42,200 85,689 0,000 0,688 1,000 
Xo Probabilidade de recomendar 103,085º 5 20,617 30,702 0,000 0,442 1,000 
X Probabilidade de compra 65,879º 5 13,176 27,516 0,000 0,415 1,000 
X, X Satisfação 89,995 2 44,998 91,370 0,000 0,485 1,000 
Xo Probabilidade de recomendar 32,035 2 16,017 23,852 0,000 0,197 1,000 
X» Probabilidade de compra 26,723 2 13,362 27,904 0,000 0,223 1,000 
X, Xo Satisfação 36,544 1 36,544 74,204 0,000 0,277 1,000 
Xo Probabilidade de recomendar 23,692 1 23,692 35,282 0,000 0,154 1,000 
X» Probabilidade de compra 9,762 1 9,762 20,386 0,000 0,095 0,994 
XXX Xo Satisfação 9,484 2 4,742 9,628 0,000 0,090 0,980 
Xo Probabilidade de recomendar 8,861 2 4,430 6,597 0,002 0,064 0,908 
X» Probabilidade de compra 3,454 2 1,727 3,607 0,029 0,036 0,662 


?Computado usando alfa = 0,05 

ºR? = 0,688 (Rº ajustado = 0,680) 
“Rê = 0,442 (Rº ajustado = 0,427) 
“PR? = 0,415 (Rº ajustado = 0,400) 


(Continuação) 
mente, X, (Tipo de cliente) e X, (Sistema de distribui- 
ção) têm um impacto significante (efeito principal) sobre 
as três variáveis de resultados de compra, tanto em con- 
junto quanto separadamente, como demonstrado pelos 
testes multivariados e univariados. 

O impacto de duas variáveis independentes pode ser 
comparado examinando-se os tamanhos relativos de efei- 
to mostrados por m (eta ao quadrado). Os tamanhos de 
efeitos para cada variável são relativamente semelhantes, 
indicando um impacto similar de cada um sobre as variá- 
veis dependentes. Tal comparação dá uma avaliação de 
significância prática separada dos testes estatísticos de 
significância. Quando comparado com qualquer variável 
independente, porém, o tamanho de efeito atribuível ao 
efeito de interação é muito menor. 


Estágio 5: Interpretação dos resultados 


A interpretação de um planejamento fatorial en MANO- 
VA é uma combinação de julgamentos obtidos de testes es- 
tatísticos e do exame dos dados básicos. A presença de um 
efeito de interação pode ser avaliada estatisticamente, mas 
as conclusões resultantes são baseadas principalmente no 
Julgamento do pesquisador. Este deve examinar as diferen- 
ças com significância prática, além daquelas de significân- 
cia estatística. Se comparações específicas entre os grupos 
puderem ser formuladas, então comparações planejadas 
podem ser especificadas e diretamente testadas na análise. 


Interpretação dos efeitos de interação 

e dos efeitos principais 

Significância estatística pode ser suportada pelos testes 
multivariados, mas o exame dos testes para cada variável 
dependente fornece uma visão crítica sobre os efeitos vis- 
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tos nos testes multivariados. Além disso, o pesquisador 
pode empregar comparações planejadas ou mesmo testes 
post hoc para determinar a verdadeira natureza de dife- 
renças, particularmente quando termos de interação sig- 
nificantes são descobertos. 


Com os efeitos de interação e os efeitos principais jul- 
gados como estatisticamente significantes tanto pelos 
testes multivariados quanto univariados, a interpreta- 
ção ainda é fortemente apoiada nos padrões de efeitos 
mostrados nos valores dos seis grupos (ver Tabela 6-12 
e Figura 6-9). 


Interação de X, por X,. As retas não-paralelas para 
cada medida dependente retratam notavelmente o es- 
treitamento das diferenças em canais de distribuição 
para clientes de 1 a 5 anos. Apesar de os efeitos de X, e 
X, ainda estarem presentes, vemos algumas diferenças 
sensíveis nestes impactos dependendo de quais conjun- 
tos específicos de clientes examinamos. 


Efeito principal de X,. Seu efeito principal é ilustrado 
para todos os três resultados de compra inclinando-se 
para cima as retas através dos três níveis de X, sobre o 
eixo X. Aqui podemos ver que os efeitos são consisten- 
tes com descobertas anteriores no sentido de que todos 
os três resultados de compra aumentam favoravelmen- 
te quando o tempo de relacionamento com a HBAT 
avança. 


Efeito principal de X,. A separação das duas retas 
representando os dois canais de distribuição mostra 
que o canal direto gera resultados de compra mais fa- 
voráveis. 


Covariáveis potenciais 

O pesquisador dispõe também de uma ferramenta adicio- 
nal — adição de covariáveis — para melhorar a análise e 
a interpretação das variáveis independentes. O papel da 
covariável é controlar os efeitos fora do escopo da análi- 
se MANOVA que possam afetar as diferenças de grupos 
de alguma forma sistemática (ver discussão anterior para 
mais detalhes). Uma covariável é mais efetiva quando 
ela tem correlação com as variáveis dependentes, mas é 
relativamente pouco correlacionada com as independen- 
tes em uso. Deste modo, isso pode explicar variância não 
atribuível às variáveis independentes (devido à pequena 
correlação com as mesmas), mas ainda assim reduzir a 
magnitude da variação geral a ser explicada (a correlação 
com as medidas dependentes). 


único candidato possível era X,,, representando o per- 
centual de compras de clientes vindas da HBAT. O mo- 
tivo seria controlar a dependência percebida ou real de 
firmas sobre a HBAT, como representado em X,,. Fir- 
mas com maior dependência podem reagir de maneira 
bastante diferente às variáveis sendo consideradas. 

Contudo, X,, é um candidato pobre para se tornar 
uma covariável apesar de atender ao critério de ser cor- 
relacionada com as variáveis dependentes. Sua falha fa- 
tal é o elevado grau de diferenças percebidas sobre X, 
e X,. Tais diferenças sugerem que os efeitos de X, e X, 
seriam severamente perturbados pelo uso de X,, como 
covariável. Logo, nenhuma covariável será empregada 
nesta análise. 


Os pesquisadores HBAT tinham opções limitadas na es- 
colha de covariáveis para essas análises MANOVA. O 


Resumo 


Os resultados refletidos nos efeitos principal e de inte- 
ração apresentam uma convincente evidência de que as 
reações pós-compras de clientes de HBAT são influencia- 
das pelo tipo de sistema de distribuição e pelo tempo de 
relacionamento. 


O sistema de distribuição direta é associado com níveis 
maiores de satisfação de clientela, bem como probabili- 
dade de novas compras futuras e de recomendação de 
HBAT para outros. Analogamente, clientes com rela- 
cionamentos mais longos também relatam níveis maio- 
res nas três variáveis dependentes. As diferenças entre 
as variáveis dependentes são menores entre aqueles 
clientes que têm feito negócios com a HBAT entre 1 e 
5 anos. 


O uso de MANOVA neste processo permite ao pes- 
quisador controlar em maior extensão a taxa de erro Tipo 
I do que no caso de comparações individuais serem feitas 
sobre cada variável dependente. As interpretações per- 
manecem válidas mesmo depois que o impacto de outras 
variáveis dependentes tenha sido levado em conta. Esses 
resultados confirmam as diferenças encontradas entre os 
efeitos das duas variáveis independentes. 


UMA VISÃO GERENCIAL 
DOS RESULTADOS 


Os pesquisadores da HBAT fizeram várias ANOVAs e 
MANOVASs na tentativa de compreender como os três 
resultados de compra (X,, Satisfação; X,,, Probabilidade 
de recomendar; e X,,, Probabilidade de futura compra) 
variam ao longo das características de firmas envolvidas, 
como sistema de distribuição (X.) e tipo de cliente (X,). 
Em nossa discussão, concentramo-nos sobre os resultados 
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multivariados, uma vez que eles se sobrepõem aos resul- 
tados univariados. 


A primeira análise MANOVA é direta: o tipo de canal 
de distribuição tem efeito sobre os resultados de com- 
pra? Nesse caso, o pesquisador testa se os conjuntos de 
escores médios (ou seja, as médias dos três resultados 
de compra) para cada grupo de distribuição são equiva- 
lentes. Depois de garantir que todas as suposições são 
atendidas, percebemos que os resultados revelam uma 
diferença significante no sentido de que as empresas no 
sistema direto de distribuição apresentam resultados de 
compra mais favoráveis quando comparadas com aque- 
las atendidas via corretores. Nos resultados gerais, a ad- 
ministração também precisava saber se essa diferença 
existe não apenas para a variável estatística, mas tam- 
bém para as variáveis individuais. Testes univariados 
revelaram que também havia diferenças univariadas sig- 
nificantes para cada resultado de compra. Os resultados 
multivariados e univariados significantes indicam à ad- 
ministração que o sistema direto de distribuição atende 
melhor os clientes, como indicado pelas medidas de re- 
sultados mais favoráveis. Logo, os administradores po- 
dem se concentrar na extensão dos benefícios do sistema 
direto enquanto trabalham em melhorias no sistema de 
distribuição via corretores. 

A próxima MANOVA segue a mesma abordagem, 
mas substitui uma nova variável independente, o tipo de 
cliente (ou seja, o tempo em que a firma tem sido um 
cliente), que tem três grupos (menos de 1 ano, del a 5 
anos, e mais de 5 anos). Mais uma vez, a administração 
se concentra nas três medidas de resultado para avaliar 
se diferenças significantes são encontradas no tempo de 
relação com a clientela. Ambos os testes univariado e 
multivariado apontam diferenças nas variáveis de resul- 
tado de compra nos três grupos de clientes. No entanto, 
uma questão permanece: cada grupo é diferente do ou- 
tro? Perfis de grupos mostram substanciais distinções, e 
testes post hoc indicam que para X,, (Satisfação) cada 
grupo de clientes é diferente dos demais. Para as demais 
medidas de resultado, os grupos 2 e 3 (clientes de 1 a 5 
anos e clientes com mais de 5 anos) não são diferentes 
entre si, apesar de ambos serem diferentes dos clientes 
com menos de 1 ano. A implicação disto é que para X,, e 
X,, as melhoras em resultados de compra são significan- 
tes nos primeiros anos, mas não crescem além daquele 
período. De um ponto de vista administrativo, a duração 
do relacionamento com a clientela afeta positivamente 
as percepções das firmas sobre resultados de compras. 
Ainda que aumentos na medida básica de satisfação 
sejam percebidos através da relação, o único aumento 
significante nos outros dois resultados é percebido após 
o primeiro ano. 

O terceiro exemplo aborda a questão do impacto 
combinado dessas duas características de firmas (X,, 


sistema de distribuição; e X,, duração da relação com o 
cliente) sobre os resultados de compra. As três catego- 
rias de X, são combinadas com as duas de X, para for- 
mar seis grupos. A meta é estabelecer se as diferenças 
significantes vistas para cada uma das duas característi- 
cas, quando analisadas separadamente, são também evi- 
dentes quando estudadas simultaneamente. O primeiro 
passo é rever os resultados para interações significantes: 
os resultados de compra retratam as mesmas diferenças 
entre os dois tipos de sistema de distribuição quando vis- 
tas por duração do relacionamento? As três interações 
foram percebidas como significantes, o que significa que 
as diferenças entre os sistemas direto e via corretor não 
foram constantes nos três grupos de clientes baseados 
em duração de relacionamento com clientela. O exame 
dos resultados revelou que o grupo do meio (clientes de 
1as5 anos) tem diferenças sensivelmente menores entre 
os dois sistemas de distribuição do que clientes com re- 
lações mais curtas ou mais longas. Embora este padrão 
seja válido para os três resultados de compra, e sistemas 
diretos sejam sempre avaliados mais favoravelmente 
(mantendo interações ordinais), a HBAT deve perce- 
ber que as vantagens do sistema de distribuição direta 
são contingentes em relação à extensão da relação com 
clientes. Dadas essas interações, descobriu-se ainda que 
cada característica de firma exibia impactos significantes 
sobre o resultado, como foi descoberto ao se analisar se- 
paradamente. Além disso, quando consideradas simulta- 
neamente, o impacto de cada uma sobre os resultados de 
compra era relativamente igual. 


Esses resultados permitem que os gerentes da HBAT 
identifiquem os efeitos significantes dessas características 
de firmas sobre os resultados de compras, não apenas in- 
dividualmente mas também quando combinadas. 


Resumo 


Análise multivariada de variância (MANOVA) é uma 
extensão da análise de variância (ANOVA) para acomo- 
dar mais de uma variável dependente. Trata-se de uma 
técnica de dependência que mede as diferenças para duas 
ou mais variáveis dependentes métricas, com base em um 
conjunto de variáveis categóricas (não-métricas) atuando 
como variáveis independentes. Este capítulo ajuda o lei- 
tor a fazer o seguinte: 


Explicar a diferença entre a hipótese nula univariada de 
ANOVA e a correspondente de MANOVA. Assim 
como ANOVA, MANOVA está preocupada com di- 
ferenças entre grupos (ou tratamentos experimentais). 
ANOVA é chamada de procedimento univariado porque 
é usada para avaliar diferenças de grupos em uma única 
variável dependente métrica. A hipótese nula é que as 
médias de grupos para uma única variável dependen- 
te são iguais (não estatisticamente diferentes). Métodos 
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univariados para avaliação de diferenças de grupos são o 
teste t (dois grupos) e a análise de variância (ANOVA) 
para dois ou mais grupos. O teste t é muito usado porque 
funciona com grupos pequenos e é muito fácil de aplicar 
e interpretar. Mas suas limitações incluem: (1) acomoda 
apenas dois grupos; e (2) pode avaliar apenas uma variá- 
vel independente por vez. Apesar de um teste t poder ser 
realizado com ANOVA, a estatística F tem a habilidade 
de testar diferenças entre mais de dois grupos, bem como 
incluir mais de uma variável independente. Além disso, 
variáveis independentes não são limitadas a apenas dois 
níveis, mas podem ter tantos níveis (grupos) quanto se 
queira. MANOVA é considerada um procedimento mul- 
tivariado por ser utilizado para avaliar diferenças de gru- 
pos em múltiplas variáveis dependentes métricas simulta- 
neamente. En MANOVA, cada grupo de tratamento é 
observado quanto a duas ou mais variáveis dependentes. 
Assim, a hipótese nula é que o vetor de médias para múl- 
tiplas variáveis dependentes é igual ao longo dos grupos. 
Os procedimentos multivariados para teste de diferenças 
de grupos são o T” de Hotelling e a análise multivariada 
de variância, respectivamente.* 


Discutir as vantagens de uma abordagem multivariada 
para teste de significância em comparação com os méto- 
dos univariados mais tradicionais. Como procedimentos 
de inferência estatística, as técnicas univariadas (teste t e 
ANOVA) e suas extensões multivariadas (T” de Hotelling 
e MANOVA) são empregadas para avaliação da signifi- 
cância estatística de diferenças entre grupos. No caso uni- 
variado, uma única medida dependente é testada quanto 
a igualdade ao longo dos grupos. No caso multivariado, 
uma variável estatística é testada quanto a igualdade. 
Em MANOVA, na realidade o pesquisador tem duas va- 
riáveis estatísticas, uma para as variáveis dependentes e 
outra para as independentes. A variável estatística de va- 
riáveis dependentes é de maior interesse, pois as medidas 
métricas dependentes podem ser concatenadas em uma 
combinação linear, como já vimos em regressão múltipla 
e análise discriminante. O aspecto ímpar de MANOVA é 
que a variável estatística combina de maneira otimizada 
as múltiplas medidas dependentes em um único valor que 
maximiza as diferenças nos grupos. Para analisar dados 
sobre múltiplos grupos e variáveis usando métodos uni- 
variados, o pesquisador poderia ficar tentado a conduzir 
testes ft separados para as diferenças entre cada par de mé- 
dias (ou seja, grupo 1 versus 2; grupo 1 versus 3; e grupo 2 
versus 3). Mas múltiplos testes t inflacionam a taxa geral 
de erro Tipo I. ANOVA e MANOVA evitam esta infla- 
ção de erro tipo I devido a múltiplas comparações de gru- 
pos de tratamento, determinando em um único teste se o 
conjunto inteiro de médias amostrais sugere que as amos- 
tras foram extraídas da mesma população geral. Ou seja, 


*N. de R.T.: A frase correta seria “Os procedimentos multivariados 
para teste de diferenças de dois grupos ou mais de dois são o Tº de 
Hotelling e a análise multivariada de variância, respectivamente. 


ambas as técnicas são usadas para determinar a probabi- 
lidade de que diferenças em médias ao longo de diversos 
grupos são devidas apenas a erro amostral. 


Estabelecer as suposições para o uso de MANOVA. Os 
procedimentos de teste de ANOVA são válidos em um 
sentido prático se consideramos que a variável dependen- 
te é normalmente distribuída, os grupos são independen- 
tes em suas respostas sobre a variável dependente, e que 
variâncias são iguais para todos os grupos de tratamento. 
No entanto, há evidência de que testes Fem ANOVA são 
robustos com relação a essas suposições, exceto em casos 
extremos. Para os procedimentos de teste de MANOVA 
serem válidos, três suposições devem ser atendidas: (1) 
as observações devem ser independentes, (2) as matrizes 
de variância-covariância devem ser iguais para todos os 
grupos de tratamento e (3) o conjunto de variáveis depen- 
dentes deve seguir uma distribuição normal multivariada. 
Além de tais promissas, o pesquisador deve considerar 
dois aspectos que influenciam os possíveis efeitos — a line- 
aridade e a multicolinearidade da variável estatística das 
variáveis dependentes. 


Compreender como interpretar resultados MANO- 
VA. Se os tratamentos resultam em diferenças estatis- 
ticamente significantes no vetor de médias de variáveis 
dependentes, o pesquisador então examina os resultados 
para entender como cada tratamento impacta as medidas 
dependentes. Três passos estão envolvidos: (1) interpretar 
os efeitos de covariáveis, se incluídas; (2) avaliar quais va- 
riáveis dependentes exibem diferenças nos grupos de cada 
tratamento; e (3) identificar se os grupos diferem em uma 
só variável dependente ou na variável estatística depen- 
dente inteira. Quando um efeito significante é descoberto, 
dizemos que existe um efeito principal, o que significa que 
há diferenças significantes entre as variáveis dependentes 
dos dois ou mais grupos definidos pelo tratamento. Com 
dois níveis de tratamento, um efeito principal significante 
garante que os dois grupos são significativamente distin- 
tos. Com três ou mais níveis, porém, um efeito principal 
significante não garante que todos os três grupos sejam 
substancialmente distintos, mas apenas que existe pelo 
menos uma diferença significante em um par de grupos. 
Se existe mais de um tratamento na análise, o pesquisa- 
dor deve examinar os termos de interação para ver se eles 
são significantes, e, assim sendo, se eles permitem ou não 
uma interpretação dos efeitos principais. Se houver mais 
de dois níveis para um tratamento, o pesquisador deve 
executar uma série de testes adicionais entre os grupos 
para ver quais pares dos mesmos são significantemente 
diferentes. 


Descrever o objetivo de testes post hoc em ANOVA e 
MANOVA. Apesar de os testes univariados e multiva- 
riados de ANOVA e MANOVA permitirem rejeitar a hi- 
pótese nula de que as médias de grupos são todas iguais, 
eles não apontam onde estão as diferenças significantes 
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se houver mais de dois grupos. Testes t múltiplos sem 
qualquer forma de ajuste não são adequados para testar 
a significância de diferenças entre as médias de pares de 
grupos porque a probabilidade de um erro Tipo I aumen- 
ta com o número de comparações realizadas entre grupos 
(semelhante ao problema de se usar múltiplas ANOVAs 
univariadas no lugar de MANOVA). Se o pesquisador 
quer sistematicamente examinar diferenças de grupos nos 
pares específicos dos mesmos quando há uma ou mais me- 
didas dependentes, dois tipos de testes estatísticos devem 
ser usados: post hoc e a priori. Testes post hoc examinam 
as variáveis dependentes entre todos os possíveis pares de 
diferenças de grupos que são testados depois que os pa- 
drões de dados foram estabelecidos. Testes a priori são 
planejados de um ponto de vista teórico ou prático (to- 
madas de decisão) antes de olhar os dados. A principal 
diferença entre os dois tipos de teste é que a abordagem 
post hoc avalia todas as possíveis combinações, fornecen- 
do uma maneira simples de comparações entre grupos, 
mas ao custo de menor poder. Testes a priori examinam 
apenas comparações especificadas, de modo que o pes- 
quisador deve definir explicitamente a comparação a ser 
feita, mas com um nível de poder resultante maior. Qual- 
quer método pode ser usado para examinar uma ou mais 
diferenças de grupo, apesar de os testes a priori também 
viabilizarem ao pesquisador controle sobre os tipos de 
comparações feitas entre grupos. 


Interpretar resultados de interação quando mais de uma 
variável independente é empregada em MANOVA. O 
termo de interação representa o efeito conjunto de dois 
ou mais tratamentos. Sempre que um planejamento de 
pesquisa tem dois ou mais tratamentos, o pesquisador 
deve primeiramente examinar as interações antes que 
qualquer declaração possa ser feita sobre os efeitos prin- 
cipais. Efeitos de interação são avaliados com os mesmos 
critérios dos efeitos principais. Se os testes estatísticos in- 
dicam que a interação é não-significante, isso denota que 
os efeitos dos tratamentos são independentes. Indepen- 
dência em planejamentos fatoriais significa que o efeito 
de um tratamento (diferenças de grupos) é o mesmo para 
cada nível do(s) outro(s) tratamento(s) e que os efeitos 
principais podem ser diretamente interpretados. Se as in- 
terações são consideradas estatisticamente significantes, é 
crucial que o pesquisador identifique o tipo de interação 
(ordinal versus desordinal), pois isso tem impacto direto 
sobre a conclusão que pode ser extraída dos resultados. 
Interação ordinal ocorre quando os efeitos de um trata- 
mento não são iguais nos níveis de outro tratamento, mas 
as diferenças de grupos estão sempre na mesma direção. 
Interação desordinal acontece quando as diferenças entre 
níveis “mudam de direção” dependendo da maneira como 
eles estão combinados com níveis de outro tratamento. 
Aqui os efeitos de um tratamento são positivos para al- 
guns níveis e negativos para outros do outro tratamento. 


Descrever o propósito da análise multivariada de cova- 
riância (MANCOVA). Covariáveis podem desempe- 
nhar um importante papel ao incluir variáveis métricas em 
um planejamento MANOVA ou ANOVA. No entanto, 
uma vez que covariáveis atuam como medidas “de contro- 
le” sobre a variável estatística dependente, elas devem ser 
avaliadas antes que os tratamentos sejam examinados. O 
papel mais importante das covariáveis é o impacto geral 
nos testes estatísticos para os tratamentos. O método mais 
direto para avaliar esses impactos é fazer a análise com e 
sem as covariáveis. Covariáveis efetivas melhoram o po- 
der estatístico dos testes e reduzem a variância interna de 
grupos. Se o pesquisador não perceber qualquer melhora 
substancial, as covariáveis podem ser eliminadas, pois elas 
reduzem os graus de liberdade disponíveis para os testes 
de efeitos de tratamento. Esta abordagem pode também 
identificar aqueles casos nos quais a covariável é “muito 
poderosa” e reduz a variância a um ponto em que os tra- 
tamentos são todos não-significantes. Frequentemente 
isso acontece quando é incluída uma covariável que é cor- 
relacionada com uma das variáveis independentes e assim 
“remove” esta variância, reduzindo desse modo o poder 
explanatório da variável independente. Como MANCO- 
VA e ANCOVA são aplicações de procedimentos de re- 
gressão dentro do método de análise de variância, avaliar 
o impacto das covariáveis sobre as variáveis dependentes 
é bastante parecido com o exame de equações de regres- 
são. Se o impacto geral é considerado significante, cada 
covariável pode ser examinada quanto à força da relação 
preditiva com as medidas dependentes. Se as covariáveis 
representam efeitos teóricos, então tais resultados forne- 
cem uma base objetiva para aceitar ou rejeitar as relações 
propostas. Sob uma perspectiva prática, o pesquisador 
pode examinar o impacto das covariáveis e eliminar aque- 
las com efeito pequeno ou nulo. 

Frequentemente não é realista considerar que uma 
diferença entre tratamentos experimentais se manifeste 
apenas em uma única variável dependente medida. Mui- 
tos pesquisadores lidam com situações de múltiplos crité- 
rios por meio da aplicação repetida de testes univariados 
individuais até que todas as variáveis dependentes tenham 
sido analisadas. Essa abordagem pode aumentar seria- 
mente as taxas de erro Tipo I, e ignora a possibilidade de 
que alguma composição das variáveis dependentes possa 
fornecer a evidência mais forte de diferenças de grupos. 
MANOVA pode resolver os dois problemas. 


Questões 


1. Quais são as diferenças entre MANOVA e análise discrimi- 
nante? Quais situações são mais adequadas a cada técnica 
multivariada? 

2. Planeje um experimento MANOVA fatorial com dois fato- 
res. Quais são as diferentes fontes de variância em seu expe- 
rimento? O que uma interação significante diria a você? 
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3. 


Além da significância geral, ou global, há pelo menos três 
abordagens para fazer testes adicionais: (a) uso de procedi- 
mentos de contraste de Scheffé; (b) análise stepdown, que 
é semelhante à regressão stepwise, no sentido de que cada 
estatística F sucessiva é computada depois de se eliminarem 
os efeitos das variáveis dependentes prévias; e (c) exame 
das funções discriminantes. Faça uma lista das vantagens e 
desvantagens práticas de cada abordagem. 

Como o poder estatístico é afetado por decisões de planeja- 
mento estatístico e de pesquisa? Como você planejaria um 
estudo para garantir um poder adequado? 

Descreva algumas situações de análise de dados nas quais 
MANOVA e MANCOVA seriam adequadas em suas 
áreas de interesse. Quais tipos de variáveis ou covariáveis 
não controladas poderiam estar operando em cada situa- 
ção? 


Leituras sugeridas 

Uma lista de leituras sugeridas que ilustram aspectos e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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CAPÍTULO 


Análise Conjunta 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


Explicar os muitos usos administrativos da análise conjunta. 

Conhecer as orientações para a seleção das variáveis a serem examinadas pela análise 

conjunta 

Formular o plano experimental para uma análise conjunta. 

Entender como criar planejamentos fatoriais. 

Explicar o impacto da escolha de ordenamento versus avaliações como a medida de 
preferência. 

m Avaliar a importância relativa das variáveis preditoras e cada um dos níveis em que elas 
afetam os julgamentos de consumidores. 

= Aplicar um simulador de escolha a resultados da análise conjunta para a previsão de 
julgamentos de consumidores de novas combinações de atributos. 

m (Comparar um modelo de efeitos principais e um modelo que envolva termos de interação e 
mostrar como avaliar a validade de um modelo versus o outro. 

= Reconhecer as limitações da análise conjunta tradicional e selecionar a metodologia alternativa 
adequada (p.ex., análise conjunta adaptativa ou baseada em escolhas) quando necessário. 


Apresentação do capítulo 


Desde meados da década de 1970, a análise conjunta tem atraído considerável atenção como um mé- 
todo que retrata de forma realista decisões de consumidores, como trocas entre produtos ou serviços 
de múltiplos atributos [35]. A análise conjunta ganhou ampla aceitação e uso em muitas indústrias, com 
taxas de uso crescentes em mais de dez vezes na década de 1980 [114]. Durante a década de 1990, 
a aplicação da análise conjunta aumentou ainda mais, se espalhando por quase todos os campos de 
estudo. A crescente utilização da análise conjunta em marketing no desenvolvimento de novos pro- 
dutos para consumidores levou à sua adoção em muitas outras áreas, como segmentação, marketing 
industrial, preços e anúncios [31, 61]. Essa ascensão de uso nos Estados Unidos também tem ocorrido 
paralelamente em outras partes do mundo, particularmente na Europa [119]. 

Coincidiu com esse contínuo crescimento o desenvolvimento de métodos alternativos para construir 
as tarefas de escolha para consumidores e estimar os modelos conjuntos. A maioria das técnicas multi- 
variadas que discutimos neste texto estabeleceram-se no campo estatístico. A análise conjunta, porém, 
continuou e continuará a se desenvolver em termos de seu planejamento, estimação e aplicações den- 
tro de muitas áreas de pesquisa [14]. 

O uso de análise conjunta acelerou com a ampla introdução de programas de computador que 
integram o processo inteiro, desde a geração de combinações de valores de variáveis independentes 
a serem avaliados até a criação de simuladores de escolha para prever escolhas de consumidores em 
muitas formulações alternativas de produtos e serviços. Hoje diversos pacotes de grande uso podem 
ser acessados por qualquer pesquisador que tenha um computador pessoal [9, 10, 11, 41, 86, 87, 88, 
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92, 96, 97]. Além disso, a conversão do desenvolvimento de pesquisas em programas disponíveis em 
computadores pessoais continua [14], e o interesse nesses softwares é crescente [13, 69, 70]. 

Em termos do modelo de dependência básico discutido no Capítulo 1, a análise conjunta pode ser 
expressa como 


Y =M+M+X +... + Xy 


(não-métrica ou métrica) (não-métricas) 


Com o uso de variáveis independentes não-métricas, análise conjunta faz lembrar da análise de 
variância (ANOVA), que tem uma fundamentação na análise de experimentos. Como tal, a análise con- 
junta é fortemente relacionada com a experimentação tradicional. Comparemos um experimento tradi- 
cional com uma análise conjunta. 


e Experimento tradicional: Um químico em uma fábrica de sabão pode querer saber o efeito da tempera- 
tura e pressão nos tambores de sabão sobre a densidade do produto final resultante. O químico poderia 
conduzir múltiplos experimentos laboratoriais para medir essas relações. Uma vez que os experimentos 
fossem realizados, eles poderiam ser analisados com procedimentos de ANOVA (análise de variância) 
como os discutidos no Capítulo 6. 

e Análise conjunta: Em situações que envolvem comportamento humano, frequentemente precisamos 
também conduzir “experimentos” com os fatores que controlamos. Por exemplo, a barra de sabão deve 
ser leve ou fortemente aromatizada? Ela deve ser promovida como cosmética, ou limpante e/ou deso- 
dorizadora? Qual entre três preços deveria ser cobrado? Deveríamos usar nossa marca de família ou 
um nome genérico? A técnica de análise conjunta desenvolveu-se a partir da necessidade de analisar 
os efeitos dos fatores que controlamos (variáveis independentes) mas que são frequentemente especi- 
ficados em termos qualitativos ou medidos aproximadamente [28, 30]. 


Nas duas situações, o pesquisador tem um número limitado de atributos que podem ser sistema- 
ticamente variados em quantia ou caráter (p.ex., temperatura alta ou baixa, quantia de fragrância). 
Apesar de podermos tentar usar o formato experimental tradicional para compreender preferências 
de clientes, isso requer grandes quantias de respondentes e só faz comparações entre grupos (rever 
o Capítulo 6 quanto a considerações de planejamento). Como opção, a análise conjunta oferece ao 
pesquisador uma técnica que pode ser aplicada a um único indivíduo ou a um grupo de indivíduos e 
fornecer uma perspectiva não apenas sobre as preferências para cada atributo (p.ex., fragrância), mas 
também a quantia do mesmo (leve ou alta). 

A análise conjunta é na verdade uma família de técnicas e métodos especificamente desenvolvidos 
para entender preferências individuais que compartilham uma fundamentação teórica com base nos 
modelos de integração de informação e medição funcional [58]. Ela é mais adequada para compreen- 
der reações de consumidores e avaliações de combinações pré-determinadas de atributos que repre- 
sentam produtos ou serviços potenciais. A flexibilidade e a peculiaridade da análise conjunta surgem a 
partir do que se segue: 


e Uma habilidade em acomodar tanto uma variável dependente métrica quanto não-métrica 
e O uso de variáveis preditoras categóricas 
e Suposições muito gerais sobre as relações de variáveis independentes com a dependente 


Como vemos nas seções adiante, a análise conjunta fornece ao pesquisador uma visão substancial da 
composição de preferências de consumidores ao mesmo tempo que mantém um alto grau de realismo. 


SST 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 
pontos que merecem destaque no capítulo e referências cru- 
zadas nos termos-chave estão em itálico. Exemplos ilustrati- 
vos estão em quadros. 


Abordagem conjunta baseada em escolha Forma alternativa 
de tarefa conjunta para coleta de respostas e estimação do 
modelo conjunto. A principal diferença é que os respondentes 
selecionam um único estímulo de perfil completo a partir de um 
conjunto de estímulos (conhecido como conjunto de escolhas), 
em vez de avaliar ou ordenar cada estímulo separadamente. 


Análise Bayesiana Procedimento alternativo de estimação ba- 
seado em estimativas de probabilidade a partir de casos in- 
dividuais e da população de amostra* que são combinadas 
para estimar o modelo conjunto. 

Análise conjunta adaptativa Metodologia para conduzir uma 
análise conjunta que conta com informações adicionais de 
respondentes não presentes na tarefa conjunta real (p.ex., 
importância de atributos). Tal informação é então usada para 
adaptar e simplificar a tarefa conjunta. Exemplos são os mo- 
delos auto-explicados e adaptativos ou híbridos. 


* N. de R. T.: A frase correta seria “a partir de observações de dados 
reais e da ocorrência do conjunto de observações na população”. 
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Análise conjunta tradicional Metodologia que emprega os 
princípios “clássicos” da análise conjunta na tarefa conjunta, 
usando um modelo aditivo da preferência de consumidor e 
métodos de apresentação de comparação pareada ou de 
perfil completo. 

Conjunto de escolhas Conjunto de estímulos de perfil comple- 
to construído por meio de princípios de delineamento experi- 
mental e usado na abordagem baseada em escolha. 

Correlação ambiental Ver correlação inter-atributos. 

Correlação inter-atributo Também conhecida como correla- 
ção ambiental, é a correlação entre atributos que torna as 
combinações de atributos inacreditáveis ou redundantes. 
Uma correlação negativa descreve a situação na qual se 
considera que dois atributos naturalmente operam em dife- 
rentes direções, como potência e desempenho em termos de 
quilômetros percorridos por litro de gasolina de um veículo. 
Quando um aumenta, o outro naturalmente diminui. Assim, 
por conta dessa correlação, todas as combinações desses 
dois atributos (p.ex., alto desempenho e alta potência) são 
inacreditáveis. Os mesmos efeitos podem ser vistos para cor- 
relações positivas, nas quais talvez preço e qualidade são 
considerados como positivamente correlacionados. Pode ser 
inacreditável encontrar um produto de elevado preço e baixa 
qualidade em tal situação. A presença de fortes correlações 
inter-atributos exige que o pesquisador examine cuidadosa- 
mente os estímulos apresentados aos respondentes e evite 
combinações inacreditáveis que não são úteis na estimação 
das utilidades parciais. 

Efeitos de interação Efeitos de uma combinação de caracte- 
rísticas relacionadas (variáveis independentes), também co- 
nhecidas como termos de interação. Ao avaliar o valor, uma 
pessoa pode designar um único valor a combinações especí- 
ficas de características que vai contra a regra de composição 
aditiva. Por exemplo, considere que uma pessoa está ava- 
liando produtos bucais descritos pelos dois fatores (atributos) 
de cor e marca. Considere ainda que essa pessoa tem uma 
preferência média pelos atributos vermelho e marca X, quan- 
do considerados separadamente. Assim, quando essa com- 
binação específica de níveis (vermelho e marca X) é avaliada 
com a regra de composição aditiva, o produto vermelho de 
marca X tem uma avaliação de preferência geral esperada em 
algum lugar no meio de todos os possíveis estímulos. Se, po- 
rém, a pessoa realmente prefere o produto bucal vermelho de 

marca X mais do que qualquer outro estímulo, mesmo algum 

que esteja acima de outras combinações de atributos (cor e 

marca) que tenham melhores avaliações das características 

ndividuais, então uma interação é percebida. Essa avaliação 

única de uma combinação que é maior (ou poderia ser me- 

or) do que o esperado com base nos julgamentos separados 

ndica uma interação em dois sentidos. Interações de ordem 
mais alta (três sentidos ou mais) podem ocorrer entre mais 
combinações de níveis. 

Efeitos principais Efeito direto de cada fator (variável indepen- 
dente) sobre a variável dependente. Pode ser complementa- 
do por efeitos de interação em situações específicas. 

Eficiência de planejamento Grau em que um planejamento 
condiz com um planejamento ortogonal. Essa medida é usada 
principalmente para avaliar e comparar planejamentos quase 


= 


ortogonais. Os valores da eficiência de planejamento variam 
de O a 100, o qual denota um planejamento ótimo. 

Estímulo Conjunto específico de níveis (um por fator) avaliado 
por respondentes (também conhecido como um tratamento). 
Os estímulos tomam diferentes formas dependendo do tipo 
de apresentação (perfil completo, comparação pareada ou 
troca). Um método de definir planejamento de estímulos é o 
planejamento fatorial, que cria estímulos separados para cada 
combinação de todos os níveis. Por exemplo, três fatores com 
dois níveis cada criariam oito (2 x 2 x 2) estímulos. No entanto, 
em muitas análises conjuntas, o número total de combinações 
é muito grande para um respondente avaliar todas. Nesses 
casos, alguns subconjuntos de estímulos são criados de acor- 
do com um plano sistemático, geralmente um planejamento 
fatorial fracionário. 

Estímulos de validação Conjunto de estímulos que não são 
usados na estimação de utilidades parciais. As utilidades 
parciais estimadas são então usadas para prever a prefe- 
rência pelos estímulos de validação para avaliar a validade 
e a confiabilidade das estimativas originais. É semelhante em 
conceito à amostra de validação de respondentes em análise 
discriminante. 

Estímulos de validação Conjunto de estímulos que não são 
usados na estimação de utilidades parciais. Utilidades par- 
ciais estimadas são então usadas para prever preferência a 
estímulo de validação para avaliar validade e confiabilidade 
das estimativas originais. Conceitualmente semelhante à 
amostra de validação de respondentes em análise discri- 
minante. 

Estrutura de preferência Representação da importância ou uti- 
lidade relativa de cada fator e do impacto de níveis individuais 
que afetam a utilidade. 

Fator Variável independente que o pesquisador manipula e que 
representa um atributo específico. Na análise conjunta, os fa- 
tores são não-métricos. Os fatores devem ser representados 
por dois ou mais valores (também conhecidos como níveis), 
os quais também são especificados pelo pesquisador. 

Heterogeneidade de respondente A variação em utilidades 
parciais ao longo de indivíduos específicos encontrados em 
modelos desagregados. Quando modelos agregados são 
estimados, modificações no processo de estimação podem 
diminuir esta variação esperada em utilidades parciais. 

Inversão Uma violação de uma relação monotônica, na qual a 
utilidade parcial estimada para um nível é maior/menor do que 
deveria ser em relação a outro nível. Por exemplo, em distân- 
cias percorridas a lojas, aquelas mais próximas são imagina- 
das como tendo maior utilidade do que aquelas mais afasta- 
das. Uma inversão aconteceria quando uma distância maior 
tiver uma utilidade parcial maior do que uma distância menor. 

Método de comparação pareada (ou aos pares) Método de 
apresentar um par de estímulos a um respondente para ava- 
liação em que o respondente seleciona um estímulo como 
preferido. 

Método de perfil completo Método para reunir avaliações de 
respondentes apresentando estímulos que são descritos 
em termos de todos os fatores. Por exemplo, considere que 
um doce tenha sido descrito por três fatores com dois níveis 
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cada: preço (15 ou 25 centavos), sabor (cítrico ou caramelo) 
e cor (branco ou vermelho). Um estímulo de perfil completo 
seria definido por um nível de cada fator. Um exemplo de estí- 
mulo de perfil completo seria um doce vermelho de caramelo 
que custasse 15 centavos. 

Método de troca* Método para apresentar estímulos a respon- 
dentes no qual fatores (atributos) são descritos dois por vez e 
os respondentes ordenam todas as combinações dos níveis 
em termos de preferência. 

Modelo adaptativo Técnica para simplificar a análise conjunta 
combinando os modelos conjuntos auto-explicados e tradicio- 
nais. O exemplo mais comum é a Análise Conjunta Adaptativa 
(ACA) da Sawtooth Software. 

Modelo aditivo Modelo baseado na regra de composição aditi- 
va, que considera que indivíduos simplesmente “adicionam” 
as utilidades parciais para calcular um escore geral ou valor 
total que indica utilidade ou preferência. É também conhecido 
como um modelo de efeitos principais e é o modelo conjunto 
mais simples em termos do número de avaliações e do proce- 
dimento de estimação necessários. 

Modelo auto-explicado Técnica composicional para executar 
análise conjunta na qual o respondente fornece as estimativas 
das utilidades parciais diretamente, sem fazer escolhas. 

Modelo composicional Classe de modelos multivariados que 
estima a relação de dependência com base em observações 
do respondente referentes às variáveis dependente e inde- 
pendentes. Esses modelos calculam ou “compõem” a variável 
dependente a partir dos valores fornecidos pelo respondente 
para todas as variáveis independentes. Os principais entre 
esses métodos são a análise de regressão e a análise dis- 
criminante. Esses modelos estão em contraste direto com os 
modelos decomposicionais. 

Modelo decomposicional Classe de modelos multivariados 
que decompõem as respostas individuais para estimar a rela- 
ção de dependência. Essa classe de modelos apresenta ao 
respondente um conjunto pré-definido de objetos (p.ex., pro- 
dutos ou serviços hipotéticos ou reais) e então pede uma ava- 
liação ou preferência geral do objeto. Uma vez dada, a ava- 
liação/preferência é decomposta relacionando-se os atributos 
conhecidos do objeto (que se tornam as variáveis indepen- 
dentes) com a avaliação (variável dependente). O principal 
entre esses modelos é a análise conjunta e algumas formas 
de escalonamento multidimensional (ver Capítulo 9). 

Modelo híbrido Ver modelo adaptativo. 

Nível Valor não-métrico específico que descreve um fator. Cada 
fator deve ser representado por dois ou mais níveis, mas o nú- 
mero de níveis normalmente jamais excede quatro ou cinco. 
Se o fator é métrico, deve ser reduzido a um pequeno núme- 
ro de níveis não-métricos. Por exemplo, os inúmeros valores 
possíveis de tamanho e preço podem ser representados por 
um pequeno número de níveis: tamanho (10, 12 ou 16 quilo- 
gramas); ou preço ($1,19, $1,39 ou $1,99). Se o fator é não- 
métrico, os valores originais podem ser usados como nesses 


* 


N. de R.T.: A palavra trade-off será traduzida como troca, para simpli- 
ficação do texto. A troca, no contexto da análise conjunta, consiste no 
processo de balancear ou comparar situações diferentes, ou mesmo 
opostas, e optar por uma delas. 


exemplos: cor (vermelho ou azul); marca (X, Y ou Z); ou adliti- 
vo amaciante de fábrica (presente ou ausente). 

Ortogonalidade Restrição matemática que exige que as esti- 
mativas das utilidades parciais sejam independentes uma da 
outra. Na análise conjunta, a ortogonalidade se refere à habili- 
dade de medir o efeito de mudança de cada nível de atributo 
e de sua separação dos efeitos de mudança de outros níveis 
de atributo e de erro experimental. 

Par proibido Uma combinação específica de níveis de dois fato- 
res que é proibida de ocorrer na criação de estímulos. A causa 
mais comum é a correlação inter-atributos entre os fatores. 

Planejamento Conjunto específico de estímulos conjuntos cria- 
do para exibir as propriedades estatísticas de ortogonalidade 
e balanço (ou equilíbrio). 

Planejamento balanceado Planejamento de estímulos no qual 
cada nível dentro de um fator aparece um número igual de 
vezes nos estímulos da tarefa conjunta. 

Planejamento de ligação Planejamento de estímulos para mui- 
tos fatores (atributos) no qual os atributos são transformados 
em vários grupos menores. Cada grupo de atributo tem al- 
guns atributos contidos em outros grupos, de modo que os 
resultados de cada um podem ser combinados ou ligados. 

Planejamento fatorial Método para planejar estímulos geran- 
do todas as possíveis combinações de níveis. Por exemplo, 
uma análise conjunta de três fatores com três níveis por fator 
(3x 3x3) resultaria em 27 combinações que poderiam atuar 
como estímulos na tarefa conjunta. 

Planejamento fatorial fracionário Método de planejamento de 
estímulos (ou seja, uma alternativa a um planejamento fatorial) 
que emprega apenas um subconjunto dos possíveis estímulos 
necessários para estimar os resultados com base na regra de 
composição assumida. Sua tarefa principal é reduzir o número 
de avaliações coletadas enquanto ainda mantém ortogonali- 
dade entre os níveis e as estimativas subsequentes das utili- 
dades parciais. Atinge-se este objetivo pelo delineamento de 
estímulos que pode estimar só um subconjunto de todos os 
efeitos possíveis. O planejamento mais simples é um modelo 
aditivo, no qual apenas efeitos principais são estimados. Se 
termos de interação selecionados são incluídos, estímulos adi- 
cionais são criados. O delineamento pode ser criado consul- 
tando fontes publicadas ou usando programas de computador 
que acompanham a maioria dos pacotes de análise conjunta. 

Planejamento ótimo Delineamento de estímulos que é ortogo- 
nal e balanceado. 

Quase ortogonal Característica de um planejamento de estí- 
mulos que não é ortogonal, mas no qual os desvios da orto- 
gonalidade são pequenos e cuidadosamente controlados na 
geração dos estímulos. Esse tipo de delineamento pode ser 
comparado com outros delineamentos de estímulos com me- 
didas de eficiência de planejamento. 

Regra de composição Regra usada para representar como res- 
pondentes combinam atributos para produzir um julgamento 
de valor ou utilidade relativa para um produto ou serviço. Para 
fins de ilustração, suponha que uma pessoa seja solicitada a 
avaliar quatro objetos. Considera-se que a pessoa avalia os 
atributos dos quatro objetos e cria algum valor relativo geral 
para cada um. A regra pode ser simples, como a criação de 


360 Análise Multivariada de Dados 


um peso mental para cada atributo percebido e a soma de pe- 
sos para um escore geral (modelo aditivo), ou pode ser um pro- 
cedimento mais complexo que envolva efeitos de interação. 

Relação monotônica Suposição do pesquisador de que uma 
ordem de preferência entre níveis deve se aplicar às estimati- 
vas de utilidades parciais. Exemplos podem incluir fatores ob- 
jetivos (distância menor para viagem é preferível do que dis- 
tância maior) ou mais subjetivos (qualidade maior é preferível 
a qualidade inferior). A implicação é que as utilidades parciais 
estimadas devem ter alguma ordenação nos valores, e viola- 
ções (conhecidas como inversões) devem ser abordadas. 

Simulador de escolha Procedimento que permite ao pesquisa- 
dor avaliar diversos cenários do tipo “o que aconteceria se”. 
Assim que as utilidades parciais conjuntas tenham sido esti- 
madas para cada respondente, o simulador de escolha anali- 
sa um conjunto de estímulos de perfil completo e prevê esco- 
lhas individuais e agregadas para cada estímulo no conjunto. 
Conjuntos múltiplos de estímulos podem ser analisados para 
representar qualquer cenário (p.ex., preferências por produto 
ou configurações de serviços hipotéticos ou por interações 
competitivas entre estímulos considerados componentes de 
um mercado). 

Tarefa conjunta O procedimento para reunir julgamentos sobre 
cada estímulo no planejamento conjunto usando um dos três 
tipos de método de apresentação (ou seja, perfil completo, 
comparação aos pares ou trocas). 

Tratamento Ver estímulo. 

Utilidade parcial Estimativa da análise conjunta da preferência 
ou utilidade geral associada a cada nível de cada fator usado 
para definir o produto ou serviço. 

Utilidade Um julgamento subjetivo de preferência por indiví- 
duo que representa o valor ou utilidade holística de um objeto 
específico. Em análise conjunta, utilidade é assumida como 
sendo formada pela combinação de estimativas de utilidades 
parciais para qualquer conjunto especificado de níveis com o 
uso de um modelo aditivo, talvez em conjunção com efeitos 
de interação. 

Variável estatística conjunta Combinação de variáveis inde- 
pendentes (conhecidas como fatores) especificadas pelo 
pesquisador que constituem o valor ou a utilidade total dos 
estímulos. 


O QUE É ANÁLISE CONJUNTA? 


Análise conjunta é uma técnica multivariada usada especi- 
ficamente para entender como os respondentes desenvol- 
vem preferências por quaisquer tipos de objetos (produ- 
tos, serviços ou idéias). É baseada na premissa simples de 
que os consumidores avaliam o valor de um objeto (real 
ou hipotético) combinando as quantias separadas de valor 
fornecidas por cada atributo. Além disso, clientes podem 
fornecer melhor suas estimativas de preferência julgando 
objetos formados por combinações de atributos. 
Utilidade, um julgamento subjetivo de preferência 
único para cada indivíduo, é o conceito mais fundamental 
em análise conjunta e a base conceitual para medir va- 


lor. O pesquisador que usa análise conjunta para estudar 
quais coisas determinam utilidade deve considerar diver- 
sas questões-chave: 


e Utilidade engloba todas as características do objeto, tangí- 
veis ou intangíveis, e como tal é uma medida de preferência 
geral de um indivíduo. 

e Utilidade é considerada baseada no valor colocado em cada 
um dos níveis dos atributos. Fazendo isso, respondentes 
reagem a várias combinações de níveis de atributos (p.ex., 
diferentes preços, características ou marcas) com variados 
níveis de preferência. 

e Utilidade é expressa por uma relação que reflete a manei- 
ra como a utilidade é formulada para qualquer combinação 
de atributos. Por exemplo, poderíamos somar os valores de 
utilidade associados a cada característica de um produto ou 
serviço para chegar a uma utilidade geral. Então assumiría- 
mos que produtos ou serviços com maiores valores de utili- 
dade são preferidos e têm uma maior chance de escolha. 


Para ser bem-sucedido na definição de utilidade, o pes- 
quisador deve ser capaz de descrever o objeto em termos 
de seus atributos e todos os valores relevantes para cada 
atributo. Para fazer isso, o pesquisador deve ser capaz de 
abordar com precisão três questões: 


1. Um fator representa um atributo específico ou outra caracte- 
rística do produto ou serviço. Para definir com precisão utili- 
dade, o pesquisador deve identificar todos os atributos impor- 
tantes que poderiam afetar preferência e, assim, utilidade. 

2. Cada fator é definido por seus níveis, que são os valores 
possíveis para aquele fator. Tais valores permitem ao pes- 
quisador descrever um objeto em termos de seus níveis no 
conjunto de fatores que o caracterizam. Por exemplo, nome 
de marca e preço poderiam ser dois fatores em uma análise 
conjunta. O nome de marca poderia ter dois níveis (marca 
X e marca Y), ao passo que o preço poderia ter quatro ní- 
veis (39, 49, 59 e 69 centavos). 

3. Quando o pesquisador seleciona os fatores e os níveis para 
descrever um objeto de acordo com um plano específico, a 
combinação é conhecida como um tratamento ou estímulo. 
Portanto, um estímulo para nosso exemplo simples poderia 
ser a marca X a 49 centavos. 


A análise conjunta é única entre os métodos multiva- 
riados, no sentido de que o pesquisador primeiro constrói 
um conjunto de produtos ou serviços reais ou hipotéticos 
combinando níveis selecionados de cada atributo. Criar 
essas combinações resulta em um planejamento, que é o 
conjunto de estímulos apresentados ao respondente. Essas 
combinações ou estímulos são então apresentados a res- 
pondentes, os quais fornecem apenas suas avaliações ge- 
rais, em um processo chamado de tarefa conjunta. Assim, 
o pesquisador está pedindo ao respondente para realizar 
uma tarefa realista — escolher de um conjunto de objetos. 
Os respondentes nada mais precisam dizer ao pesquisador, 
como o quão importante é um atributo individual para eles 
ou o quão bem o objeto funciona em relação a um atributo 
específico. Como o pesquisador construiu os objetos hipo- 
téticos de uma maneira específica, a influência de cada atri- 
buto e de cada valor de cada atributo sobre o julgamento 
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de um respondente quanto a utilidade pode ser determina- 
da a partir das avaliações gerais dos respondentes. 


UM EXEMPLO HIPOTÉTICO 
DE ANALISE CONJUNTA 


Como uma ilustração, consideramos uma análise conjunta 
simples para um produto hipotético com três atributos. Pri- 
meiro descrevemos o processo de definição de utilidade em 
termos de atributos (fatores) e os possíveis valores de cada 
atributo (níveis). Com os fatores especificados, o processo 
de coleta de dados de preferência através de avaliações de 
estímulos é discutido, seguido de uma visão geral da esti- 
mação de utilidade associada com cada fator e nível. 


Especificação de utilidade, 
fatores, níveis e estímulos 


A primeira tarefa é definir os atributos que constituem 
utilidade para o produto sob estudo. Uma questão-chave 
envolve a definição dos atributos que verdadeiramente 
afetam preferências e, a seguir, o estabelecimento dos va- 
lores mais apropriados para os níveis. 


Imaginemos que a HBAT* esteja tentando desenvolver 
um novo produto: um detergente industrial. Após dis- 
cussão com representantes de vendas e grupos de inte- 
resse, o administrador decide que três atributos são im- 
portantes: ingredientes de limpeza, forma de uso e nome 
da marca. Para operacionalizar esses atributos, os pes- 
quisadores criam três fatores com dois níveis cada: 


Fator Níveis 
Ingredientes Sem fosfato Com fosfato 
Forma Líquido Pó 
Nome da marca HBAT Marca genérica 


Um detergente hipotético pode ser construído sele- 
cionando-se um nível de cada atributo. Para os três atri- 
butos (fatores) com dois valores (níveis), oito (2 x 2 x 
2) combinações podem ser formadas. Três exemplos das 
oito possíveis combinações (estímulos) são: 


e Pó HBAT sem fosfato 
e Líquido genérico com fosfato 
e Líquido genérico sem fosfato 


quão importante cada fator é na decisão geral, mas também 
como os níveis distintos dentro de um fator influenciam a 
formação de uma preferência geral (utilidade). 


Obtenção de preferências a 
partir dos respondentes 


Com os estímulos definidos em termos dos atributos que 
dão origem à utilidade, o próximo passo é reunir avalia- 
ções de preferências a partir de respondentes. Este proces- 
so mostra por que a análise conjunta também é conhecida 
como análise de troca, pois ao se fazer um julgamento sobre 
um produto hipotético, os respondentes devem considerar 
as características “boas” e “ruins” do produto ao formar 
uma preferência. Assim, os respondentes devem ponde- 
rar todos os atributos simultaneamente ao fazer seus jul- 
gamentos. Respondentes podem ordenar os estímulos em 
termos de preferência ou avaliar cada combinação sobre 
uma escala de preferência (talvez uma escala de 1 a 10). 


Em nosso exemplo, a análise conjunta avalia o impacto 
relativo de cada nome de marca (HBAT versus nome 
genérico), cada forma (pó versus líquido) e os diferentes 
ingredientes de limpeza (sem fosfato versus com fosfato) 
ao determinar a utilidade de uma pessoa pela avaliação 
dos oito estímulos. Cada respondente foi colocado dian- 
te de oito descrições de produtos de limpeza (estímulos) 
e foi solicitado a colocá-las em ordem de preferência 
para compra (1 = mais preferido e 8 = menos preferido). 
Os oito estímulos são descritos na Tabela 7-1, com as or- 
dens de preferência dadas por dois respondentes. 


Essa utilidade, que representa o valor total ou prefe- 
rência geral de um objeto, pode ser imaginada como a 
soma daquilo que as partes do produto valem, ou utili- 
dades parciais. A forma geral de um modelo de análise 
conjunta pode ser mostrada como 


(Valor total para produto), ...n,= Utilidade parcial do ní- 
veli para o fator 1 
+ Utilidade parcial do nível j para o fator 2 +... 
+ Utilidade parcial do nível n para o fator m 


onde o produto ou serviço tem m atributos, cada um 
com n níveis. O produto consiste no nível i do fator 1, 
nível j do fator 1, e assim por diante até o nível n para 
o fator m. 


Construindo combinações específicas (estímulos), o pes- 
quisador tenta entender uma estrutura de preferência do 
respondente. A estrutura de preferência explica não apenas 


* N. de R. T.: Este mesmo exemplo foi apresentado na 5º edição deste 
livro, a qual apresentava a base de dados da HATCO, uma grande 
fornecedora industrial, diferentemente da HBAT, definida como 
uma fabricante de produtos de papel. 


Em nosso exemplo, o modelo mais simples representa 
a estrutura de preferência para o detergente industrial 
com base na adição de três fatores (utilidade = efeito da 
marca + efeito do ingrediente + efeito da forma). Este 
formato é conhecido como um modelo aditivo, a ser 
abordado posteriormente. A preferência por um produ- 
to de limpeza específico pode ser diretamente calculada 


(Continua) 
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TABELA 7-1 Descrições de estímulos e ordenações de respondentes para análise conjunta de 


exemplo de detergente industrial 


DESCRIÇÕES DE ESTÍMULOS 


Níveis de: Ordenações de respondentes 
Estímulo Forma Ingredientes Marca Respondente 1 Respondente 2 
1 Líquido Sem fosfato HBAT 1 1 
2 Líquido Sem fosfato Genérico 2 2 
3 Líquido Com fosfato HBAT 5 3 
4 Líquido Com fosfato Genérico 6 4 
5 Pó Sem fosfato HBAT 3 7 
6 Pó Sem fosfato Genérico 4 5 
7 Pó Com fosfato HBAT 7 8 
8 Pó Com fosfato Genérico 8 6 


Note: Os oito estímulos representam todas as combinações dos três atributos, cada um com dois níveis (2 x 2 x 2). 


(Continuação) 
a partir de valores de utilidade parcial. Por exemplo, a 
preferência pelo HBAT em pó sem fosfato é 


Utilidade = Utilidade parcial da marca HBAT 
+ Utilidade parcial do ingrediente de lim- 
peza sem fosfato 
+ Utilidade parcial do pó 


Com as estimativas das utilidades parciais, a preferên- 
cia de um indivíduo pode ser estimada por qualquer com- 
binação de fatores. Além disso, a estrutura de preferência 
revelaria os fatores mais importantes na determinação 
de utilidade geral e escolha de produto. As escolhas de 
múltiplos respondentes também poderiam ser combina- 
das para representar o ambiente competitivo percebido 
no mundo real. 


Estimação das utilidades parciais 


Como estimamos as utilidades parciais para cada nível 
quando temos apenas as avaliações ou ordenações dos es- 
tímulos? Na discussão adiante examinamos como as ava- 
liações de cada estímulo podem ser usadas para estimar as 
utilidades parciais para cada nível e, em última instância, 
para definir a importância de cada atributo também. 


Para ilustrar uma análise conjunta simples, podemos 
examinar as respostas do respondente 1. Se nos concen- 
tramos primeiramente na ordenação para cada atributo, 
percebemos que as ordenações para os estímulos com os 
ingredientes sem fosfato são as mais altas possíveis (1, 
2,3 e 4), enquanto os ingredientes baseados em fosfato 
têm as quatro colocações mais baixas (5, 6, 7 e 8). Logo, 
os ingredientes sem fosfato são claramente preferidos 
em relação ao detergente com fosfato. Isso pode ser con- 
trastado com as ordenações para cada nível de marca, 
que mostra uma mistura de postos altos e baixos para 
cada marca. 


Assumindo que o modelo básico (um modelo aditi- 
vo) se aplique, podemos calcular o impacto de cada nível 
como diferenças (desvios) da ordenação média geral. (Os 
leitores podem observar que isso é análogo à regressão 
múltipla com variáveis dicotômicas ou ANOVA.) 


Por exemplo, as ordenações médias para os dois ingre- 
dientes dos detergentes (sem fosfato versus com fosfato) 
para o respondente 1 são: 


Sem fosfato: 
Baseado em fosfato: 


(1+2+3+4)4=2,5 
(5+6+7+8)4=6,5 


Com a ordenação média dos oito estímulos de 4,5 [(1 
2+3+4+5+6+7+ 8)/8=36/8 = 4,5], o nível sem 
fosfato teria então um desvio de -2,0 (2,5 — 4,5) da média 
geral, enquanto o nível com fosfato teria um desvio de 
+2,0 (6,5 — 4,5). As ordenações médias e os desvios para 
cada fator em relação à ordenação média geral (4,5) para 
os respondentes 1 e 2 são dadas na Tabela 7-2. 

Neste exemplo, usamos números menores para indi- 
car postos mais elevados e um estímulo preferido (p.ex., 
1 = mais preferido). Quando a medida de preferência 
é inversamente relacionada à preferência, como aqui, 
invertemos os sinais dos desvios nos cálculos das utili- 
dades parciais, de modo que os desvios positivos serão 
associados às utilidades parciais que indicam maior pre- 
ferência. 


Podemos aplicar este método básico a todos os fatores 
e calcular as utilidades parciais de cada nível em quatro 
passos: 


Passo 1: Eleve os desvios ao quadrado e faça sua soma por to- 
dos os níveis. 

Passo 2: Calcule um valor de padronização que seja igual ao nú- 
mero total de níveis dividido pela soma de desvios ao 
quadrado. 

Passo 3: Padronize cada desvio quadrado multiplicando-o pelo 
valor de padronização. 
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TABELA 7-2 Ordenações médias e desvios para respondentes 1 e 2 


Nível de fator por atributo Ordenações nos estímulos 


Ordem média de nível 


Desvio da ordem média geral” 


Respondente 1 


Forma 
Líquido 1,2,5,6 3,5 —1,0 
Pó 3,4,7,8 5,5 +1,0 
Ingredientes 
Sem fosfato 1,2,3,4 2,5 —2,0 
Com fosfato 5,6,7,8 6,5 +2,0 
Marca 
HBAT 19,0; 7 4,0 —-0,5 
Genérico 2,4,6,8 5,0 +0,5 
Respondente 2 
Forma 
Líquido 1,2,3,4 2,5 -2,0 
Pó 5,6,7,8 6,5 +2,0 
Ingredientes 
Sem fosfato 1,2,5,7 3,75 —0,75 
Com fosfato 3,4,6,8 5,25 +0,75 
Marca 
HBAT 1,3,7,8 4,75 +0,25 
Genérico 2,4,5,6 4,25 —0,25 


Desvio calculado como desvio = Ordenação média de nível — Ordenação média geral (4,5). Observe que desvios negativos implicam ordena- 


ções de maior preferência. 


Passo 4: Estime a utilidade parcial calculando a raiz quadrada 
do desvio quadrado padronizado. 

Devemos observar que tais cálculos são feitos para cada 
respondente separadamente e os resultados de um respon- 
dente não afetam aqueles de qualquer outro respondente. 
Este método difere sensivelmente de técnicas como regres- 
são ou ANOVA, onde lidamos com correlações entre to- 
dos os respondentes ou diferenças de grupos. 


Vejamos como calcularíamos a utilidade parcial do primei- 
ro nível de ingredientes (sem fosfato) para o respondente 
1. Os cálculos para cada passo são os seguintes: 


Passo 1: Os desvios de 2,5* são elevados ao quadrado. Os 
desvios quadrados são somados (10,5). 

Passo 2: O número de níveis é 6 (três fatores com dois ní- 
veis cada). Logo, o valor de padronização é calcu- 
lado como 0,571 (6/10,5 = 0,571). 

Passo 3: O desvio quadrado para ingrediente sem fosfato 
(2: lembre-se que invertemos os sinais) é então 
multiplicado por 0,571 para obtermos 2,284 (2º x 
0,571= 2,284). 

Passo 4: Finalmente, para calcular a utilidade parcial para 
este nível, determinamos a raiz quadrada de 2,284, 
o que resulta em 1,1511. Este processo produz 
utilidades parciais para cada nível para os respon- 
dentes 1 e 2, como mostrado na Tabela 7-3. 


* N. de R. T.: O número correto é 4,5. 


Determinação de importância de atributo 


Como as estimativas de utilidade parcial estão em uma 
escala comum, podemos computar a importância relati- 
va de cada fator diretamente. A importância de um fator 
é representada pela amplitude de seus níveis (ou seja, a 
diferença entre o valor mais alto e o mais baixo) dividi- 
da pela soma das amplitudes por todos os fatores. Este 
cálculo fornece um impacto ou importância relativa de 
cada atributo com base na amplitude de suas estimativas 
de utilidade parcial. Fatores com um intervalo maior para 
suas utilidades parciais têm um impacto maior sobre os 
valores de utilidade calculados, e assim são considerados 
de maior importância. A importância relativa pontua em 
todos os atributos com um total de 100%. 


Por exemplo, para o respondente 1, as amplitudes dos 
três atributos são 1,512 [0,756 — (-0,756)], 3,022 [1,511 
— (-1,511)] e 0,756 [0,378 — (-0,378)]. A soma total de 
amplitudes é 5,290. A partir disso, a importância relati- 
va para os três fatores (forma, ingredientes e marca) é 
calculada como 1,512/5,290, 3,022/5,290 e 0,756/5,290, ou 
28,6%, 57,1% e 14,3%, respectivamente. 

Podemos seguir o mesmo procedimento para o se- 
gundo respondente e calcular a importância de cada fa- 
tor, com os resultados de forma (66,7%), ingredientes 
(25%) e marca (8,3%). Esses cálculos para os respon- 
dentes 1 e 2 também são exibidos na Tabela 7-3. 
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TABELA 7-3 Utilidades parciais estimadas e importância dos fatores para os respondentes 1 e 2 


Estimação das utilidades parciais 


Cálculo da importância do fator 


Desvio Desvio ao 


Desvio pa- Utilidade parcial Amplitude de uti- Importância 


Nível do fator invertido” quadrado dronizado” estimada” lidades parciais do fator” 
Respondente 1 
Forma 
Líquido +1,0 1,0 +0,571 +0,756 
; 1,512 28,6% 
Pó —1,0 1,0 —0,571 —0,756 
Ingredientes 
+ + + 
Sem fosfato 2,0 4,0 2,284 1,511 3,022 571% 
Com fosfato —2,0 4,0 —2,284 —1,511 
Marca 
HBAT +0,5 0,25 +0,143 +0,378 
po 0,756 14,3% 
Genérico —0,5 0,25 —0,143 —0,378 
Soma de desvios quadrados 10,5 
Valor de padronização” 0,571 
Soma de amplitudes de utilidades parciais 5,290 
Respondente 2 
Forma 
Líquido +2,0 4,0 +2,60 +1,612 
, 3,224 66,7% 
Pó —2,0 4,0 —2,60 —1,612 
Ingredientes 
fosfat +0,7 2. + + 4 
Sem fosfato 0,75 0,5625 0,365 0,60 1208 25,0% 
Com fosfato —0,75 0,5625 —0,365 —0,604 
Marca 
HBAT —0,25 0,0625 —0,02 —0,20 
Es 0,400 8,3% 
Genérico +0,25 0,0625 +0,04 +0,20 
Soma de desvios quadrados 9,25 
Valor de padronização” 0,649 
Soma de amplitudes de utilidades parciais 4,832 


“Desvios são invertidos para indicar maior preferência para ordens menores. O sinal do desvio é usado para indicar o sinal de utilidade parcial estimada. 


"Desvio padronizado é igual ao desvio quadrado vezes o valor de padronização. 
“Utilidade parcial estimada é igual à raiz quadrada do desvio padrronizado. 


“Importância do fator é igual à amplitude de um fator dividida pela soma de amplitudes em todos os fatores, e multiplicada por 100 para se conseguir um percentual. 
“Valor de padronização é igual ao número de níveis (2 + 2 + 2 = 6) dividido pela soma de desvios quadrados. 


Avaliação da precisão preditiva 

Para examinar a habilidade desse modelo em prever as es- 
colhas reais dos respondentes, prevemos a ordem de pre- 
ferência somando as utilidades parciais para as diferentes 
combinações de níveis de fator, e então ordenamos os es- 
cores resultantes. A comparação da ordem de preferência 
prevista com a ordem de preferência real do respondente 
indica a precisão preditiva. Observe que os valores totais 
das utilidades parciais não têm significado real, exceto 
como um meio de desenvolver a ordem de preferência, e 
como tal não são comparados entre respondentes. 


Os cálculos para os respondentes para os oito estímulos 
são mostrados na Tabela 7-4, com as ordens de prefe- 
rência prevista e real. Examinemos os resultados para 
esses respondentes para compreendermos o quão bem 
suas preferências foram representadas pelas estimativas 
de utilidade parcial. 


e Respondente 1: As utilidades parciais estimadas prevê- 
em a ordem de preferência perfeitamente para o res- 
pondente 1. Isso indica que a estrutura de preferência 
foi representada com sucesso nas estimativas de utilida- 
des parciais e que o respondente fez escolhas consisten- 
tes com a estrutura de preferência. 

e Respondente 2: A inconsistência nas ordenações para o 
respondente 2 proíbe uma representação completa da 
estrutura de preferência. Por exemplo, a ordenação mé- 
dia para estímulos com a marca genérica é menor que 
para aqueles com a marca HBAT (ver Tabela 7-2). Este 
resultado indica que, sendo tudo igual, os estímulos da 
marca genérica terão maior preferência. Contudo, exa- 
minando as ordens de classificação reais, essa resposta 
nem sempre é vista. Os estímulos 1 e 2 são iguais, exce- 
to para o nome de marca, mesmo que a HBAT tenha 
maior preferência. Isso também ocorre com os estímu- 
los 3 e 4. No entanto, a ordenação correta (genérica pre- 
ferida em detrimento de HBAT) é vista para os pares 


(Continua) 
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(Continuação) 
de estímulos de 5-6 e 7-8. Logo, a estrutura de preferên- 
cia das utilidades parciais terá dificuldades em prever 
esse padrão de escolha. Quando comparamos as ordens 
de classificação prevista e real (ver Tabela 7-4), vemos 
que as escolhas do respondente 2 são muitas vezes pre- 
vistas erroneamente, mas em geral o erro é de apenas 
uma posição devido àquilo que é conhecido como o 
efeito de interação (discutido em seção posterior). 


O exame da estrutura de preferência para cada indiví- 
duo fornece uma maneira de compreender o papel de cada 
atributo na avaliação de qualquer estímulo. Quanto mais 
precisa a estrutura de preferência, melhor a visão sobre o 
processo de escolha e o papel de fatores importantes. 


OS USOS GERENCIAIS DA 
ANALISE CONJUNTA 


Antes de discutir a base estatística da análise conjunta, 
devemos entender a técnica em termos de seu papel na 
compreensão da tomada de decisões de clientes e na base 
de desenvolvimento de uma estratégia [98]. O exemplo 
simples que acabamos de discutir apresenta alguns be- 
nefícios básicos da análise conjunta. A sua flexibilidade 
viabiliza sua aplicação em praticamente qualquer área na 
qual as decisões são estudadas. A análise conjunta con- 
sidera que qualquer conjunto de objetos (p.ex., marcas, 
companhias) ou conceitos (p.ex., posicionamento, benefí- 
cios, imagens) é avaliado como uma coleção de atributos. 
Após determinar a contribuição de cada fator à avaliação 


geral do consumidor, o pesquisador pode então proceder 
com o seguinte: 


1. Definir o objeto ou conceito com a combinação ótima de 
características. 

2. Mostrar as contribuições relativas de cada atributo e cada 
nível para a avaliação geral do objeto. 

3. Usar as estimativas de julgamentos de comprador ou cliente 
para prever preferências entre objetos com diferentes conjun- 
tos de características (outros elementos mantidos constantes). 

4. Isolar grupos de clientes potenciais que atribuem diferente 
importância às características para definir segmentos com 
potenciais altos e baixos. 

5. Identificar oportunidades de marketing explorando o po- 
tencial de mercado para combinações de características in- 
disponíveis no momento. 


O conhecimento da estrutura de preferência para cada 
indivíduo permite ao pesquisador ter flexibilidade quase 
ilimitada para examinar reações agregadas e individuais 
em uma ampla variedade de questões ligadas a produtos 
ou serviços. Examinaremos algumas das aplicações mais 
comuns posteriormente neste capítulo. 


COMPARAÇÃO ENTRE A 
ANÁLISE CONJUNTA E OUTROS 
MÉTODOS MULTIVARIADOS 


A análise conjunta difere de outras técnicas multivariadas 
em quatro áreas distintas: (1) sua natureza decomposicio- 
nal, (2) especificação de variável estatística, (3) o fato de 
que as estimativas podem ser feitas no nível individual, e 


TABELA 7-4 Totais de utilidades parciais previstas para cada estímulo e uma comparação de ordens de preferência reais e estimadas 


Descrição de estímulo 


Estimativas de utilidade parcial 


Ordens de preferência 


Estímulo Forma Ingredientes Marca Forma | Ingredientes Marca Total Estimadas Reais 
Respondente 1 

1 Líquido Sem fosfato HBAT 0,756 1,511 0,378 2,645 1 1 
2 Líquido Sem fosfato Genérico 0,756 1,511 —0,378 1,889 2 2 
3 Líquido Com fosfato HBAT 0,756 — 1,511 0,378 —0,377 5 5 
4 Líquido Com fosfato Genérico 0,756 — 1,511 —0,378 — 1,133 6 6 
5 Pó Sem fosfato HBAT —0,756 1,511 0,378 1,133 3 3 
6 Pó Sem fosfato Genérico —0,756 1,511 —0,378 0,377 4 4 
7 Pó Com fosfato HBAT —0,756 —1,511 0,378 —1,889 7 Fá 
8 Pó Com fosfato Genérico —0,756 = 1,511 —0,378 —2,645 8 8 
Respondente 2 

1 Líquido Sem fosfato HBAT 1,612 0,604 —0,200 2,016 2 1 
2 Líquido Sem fosfato Genérico 1,612 0,604 0,200 2,416 1 2 
3 Líquido Com fosfato HBAT 1,612 —0,604 —0,200 0,808 4 3 
4 Líquido Com fosfato Genérico 1,612 —0,604 0,200 1,208 3 4 
5 Pó Sem fosfato HBAT —1,612 0,604 —0,200  —1,208 6 rá 
6 Pó Sem fosfato Genérico —1,612 0,604 0,200  —0,808 5 5 
7 Pó Com fosfato HBAT —1,612 —0,604 —0,200  —2,416 8 8 
8 Pó Com fosfato Genérico —1,612 —0,604 0,200 —2,016 7 6 
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(4) sua flexibilidade em termos de relações entre variáveis 
dependente e independentes. 


Técnicas de composição versus de decomposição 


Muitas das técnicas multivariadas de dependência que 
examinamos em capítulos anteriores são chamadas de 
modelos de composição (p.ex., análise discriminante e 
muitas aplicações de regressão). Com tais técnicas o pes- 
quisador coleta avaliações do respondente sobre muitas 
características de produto (p.ex., preferência sobre cor, 
estilo, características específicas) e então relaciona essas 
avaliações com alguma avaliação de preferência geral 
para desenvolver um modelo preditivo. O pesquisador 
não conhece de antemão as avaliações sobre caracterís- 
ticas de produtos, mas coleta-as a partir do respondente. 
Com as análises de regressão e discriminante, as avalia- 
ções e preferências gerais do respondente são analisadas 
para “compor” a preferência geral a partir das avaliações 
do respondente sobre o produto em cada atributo. 

A análise conjunta, conhecida como um modelo de de- 
composição, difere no sentido de que o pesquisador pre- 
cisa saber apenas uma preferência geral do respondente 
para um estímulo. Os valores de cada atributo (variável 
independente) já estavam especificados pelo pesquisador 
quando o estímulo foi criado. Deste modo a análise con- 
junta pode determinar (decompor) o valor de cada atribu- 
to usando somente a medida de preferência geral. 


Especificação da variável estatística conjunta 


A análise conjunta emprega uma variável estatística muito 
parecida em forma com aquela que é usada em outras téc- 
nicas multivariadas. A variável estatística conjunta é uma 
combinação linear de efeitos das variáveis independentes 
(fatores) sobre uma variável dependente. A diferença im- 
portante é que na variável estatística conjunta o pesquisa- 
dor especifica as variáveis independentes (fatores) e seus 
valores (níveis). A única informação fornecida pelo res- 
pondente é a medida dependente. Os níveis especificados 
pelo pesquisador são então usados pela análise conjunta 
para decompor a resposta do respondente em efeitos para 
cada nível, muito parecido com o que é feito na análise de 
regressão para cada variável independente. 

Esse aspecto ilustra as características em comum en- 
tre a análise conjunta e a experimentação, sendo que de- 
linear o projeto é um passo crítico para o sucesso. Por 
exemplo, se uma variável ou efeito não foi antecipado 
no delineamento da pesquisa, então não estará disponí- 
vel para análise. Por essa razão, um pesquisador pode 
se sentir tentado a incluir diversas variáveis que possam 
ser relevantes. Contudo, a análise conjunta é limitada no 
número de variáveis que podem ser incluídas; assim, o 
pesquisador não pode simplesmente incluir questões adi- 
cionais para compensar uma falta de conceituação clara 
do problema. 


Modelos separados para cada indivíduo 


A análise conjunta difere de quase todos os outros méto- 
dos multivariados no sentido de que ela pode ser levada a 
cabo no nível individual, o que significa que o pesquisador 
gera um modelo separado para prever a estrutura de pre- 
ferência de cada respondente. A maioria dos outros méto- 
dos multivariados usa cada medida do respondente como 
uma única observação e então executa a análise usando 
todos os respondentes simultaneamente. Na verdade, 
muitos métodos exigem que um respondente forneça ape- 
nas uma única observação (a suposição de independência) 
e então desenvolvem um modelo comum para todos os 
respondentes, ajustando cada respondente com graus de 
precisão variados (representados pelos erros de previsão 
para cada observação, como resíduos em regressão). 

Em análise conjunta, porém, as estimativas podem ser 
feitas para o indivíduo (desagregado) ou grupos de indi- 
víduos que representem um segmento de mercado ou o 
mercado inteiro (agregado). Cada abordagem apresenta 
benefícios distintos: 


e No nível desagregado, cada respondente avalia estímulos 
suficientes para a análise ser executada separadamente para 
cada pessoa. A precisão preditiva é calculada para cada pes- 
soa, em vez de ser calculada somente para a amostra total. 
Os resultados individuais podem então ser agregados para 
também retratar um modelo geral (agregado). 

e Muitas vezes, porém, o pesquisador seleciona um método 
de análise agregada que executa a estimação de utilidades 
parciais para o grupo de respondentes como um todo. A 
análise agregada pode fornecer o seguinte: 

e Um meio de reduzir a tarefa de coleta de dados por meio 
de delineamentos mais complexos (discutidos em seções 
posteriores) 

e Métodos para estimar interações (como análise conjunta 
baseada em escolhas) 

e Maior eficiência estatística, pelo uso de mais observações 
na estimação. 


Ao selecionar entre análises conjuntas agregadas e de- 
sagregadas, o pesquisador deve equilibrar os benefícios 
ganhos com métodos agregados versus a visão fornecida 
pelos modelos separados para cada respondente obtidos 
com métodos desagregados. 


Flexibilidade em tipos de relações 


A análise conjunta não está limitada aos tipos de relações 
exigidas entre as variáveis dependente e independentes. 
Como discutido em capítulos anteriores, a maioria dos 
métodos de dependência considera que uma relação li- 
near existe quando a variável dependente aumenta (ou 
diminui) em iguais quantias para cada variação unitária 
na variável independente. Se algum tipo de relação não- 
linear deve ser representado, a forma do modelo deve ser 
modificada ou variáveis especializadas devem ser criadas 
(como polinômios). 


CAPÍTULO? Análise Conjunta 367 


A análise conjunta, no entanto, pode realizar previsões 
separadas para os efeitos de cada nível da variável inde- 
pendente e não considera que os níveis estejam de fato 
relacionados. A análise conjunta pode facilmente lidar 
com relações não-lineares — mesmo a complexa relação 
curvilínea, na qual um valor é positivo, o próximo é nega- 
tivo e o terceiro é novamente positivo. Além disso, os ti- 
pos de relações podem variar entre atributos. No entanto, 
como discutimos adiante, a simplicidade e flexibilidade da 
análise conjunta comparada com os outros métodos mul- 
tivariados é baseada em diversas suposições feitas pelo 
pesquisador. 


Resumo 


Como descrito nas seções anteriores, a análise conjunta 
representa um tipo híbrido de técnica multivariada para 
estimar relações de dependência. Em um sentido, ela com- 
bina métodos tradicionais (ou seja, regressãoe ANOVA), 
fornecendo muito da flexibilidade mostrada na regressão 
aliada com a tradição da experimentação de ANOVA. No 
entanto, ela é única no sentido de que é decomposicional 
por natureza, e resultados podem ser estimados para cada 
respondente em separado. Como tal, a análise conjunta 
oferece ao pesquisador uma ferramenta especializada de 
análise especificamente para compreender decisões de 
clientes e suas estruturas de preferência. Como vemos nas 
próximas seções, a análise conjunta, ao mesmo tempo que 
demanda considerável trabalho de frente no planejamen- 
to da análise em si, fornece um poderoso e esclarecedor 
método para análise de preferências e de tomadas de de- 
cisões por parte de clientes. 


PLANEJAMENTO DE 
UM EXPERIMENTO DE 
ANALISE CONJUNTA 


O pesquisador que aplica análise conjunta deve tomar 
várias decisões-chave ao planejar o experimento e anali- 
sar seus resultados. A Figura 7-1 (estágios 1-3) e a Figura 
7-4 (estágios 4-7) mostram os passos gerais seguidos no 
delineamento e execução de um experimento de análise 
conjunta. A discussão segue o paradigma de construção 
de modelo introduzido no Capítulo 1. 

O processo de decisão inicia com uma especificação 
dos objetivos da análise conjunta. Como a análise conjun- 
ta é semelhante a um experimento, a conceituação da pes- 
quisa é crítica para seu sucesso. Depois que os objetivos 
tenham sido definidos, as questões relacionadas ao verda- 
deiro plano de pesquisa são abordadas e as suposições são 
avaliadas. A discussão se foca então em como o processo 
de decisão considera a estimação real dos resultados con- 
juntos, a interpretação dos resultados e os métodos usa- 
dos para validar os resultados. A discussão termina com 


um exame do uso de resultados de análise conjunta em 
análises posteriores, como segmentação de mercado e si- 
muladores de escolha. 

Cada uma dessas decisões se origina da questão de 
pesquisa e do uso da análise conjunta como uma ferra- 
menta na compreensão das preferências do respondente 
e do processo de julgamento. Seguimos essa discussão da 
abordagem de construção de modelo examinando duas 
metodologias alternativas de análise conjunta (baseada 
em escolha e adaptativa), que são em seguida comparadas 
quanto às questões tratadas aqui para a análise conjunta 
tradicional. 


ESTÁGIO 1: OS OBJETIVOS 
DA ANALISE CONJUNTA 


Como ocorre com qualquer análise estatística, o ponto 
de partida é a questão de pesquisa. Para compreender 
decisões de clientes, a análise conjunta pode ter dois ob- 
jetivos: 


1. Determinar as contribuições de variáveis preditoras e seus 
níveis na determinação de preferências do consumidor. Por 
exemplo, quanto o preço contribui para o desejo de se com- 
prar um produto? Qual é o melhor nível de preço? Quanto 
da variação no desejo de comprar sabão pode ser explicada 
por diferenças nos níveis de preço? 

2. Estabelecer um modelo válido de julgamentos do consu- 
midor. Modelos válidos permitem prever a aceitação do 
consumidor de qualquer combinação de atributos, mesmo 
aqueles que não foram originalmente avaliados por clientes. 
Ao se fazer isso, as questões abordadas incluem o seguinte: 
as escolhas do respondente indicam uma relação linear sim- 
ples entre as variáveis preditoras e escolhas? É suficiente 
um modelo simples de “somar” o valor de cada atributo, 
ou precisamos adicionar avaliações mais complexas de pre- 
ferências para espelhar o processo de julgamento de forma 
adequada? 


O respondente reage apenas ao que o pesquisador for- 
nece em termos de estímulos (combinações de atributos). 
Esses são os verdadeiros atributos usados em uma tomada 
de decisões? Outros atributos são igualmente importan- 
tes, particularmente aqueles de natureza mais qualitativa, 
como reações emocionais? Essas e outras considerações 
exigem que a questão de pesquisa seja contextualizada em 
torno de dois aspectos importantes: 


e É possível descrever todos os atributos que conferem utili- 
dade ou valor ao produto ou serviço em estudo? 

e Quais são os critérios-chave de decisão envolvidos no pro- 
cesso de escolha para esse tipo de produto ou serviço? 


Essas questões precisam ser resolvidas antes de se 
prosseguir para a fase de delineamento de uma análise 
conjunta, pois elas fornecem uma orientação fundamental 
para decisões-chave em cada estágio. 
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Estágio 1 
Selecionar objetivos: 


Problema de pesquisa 


Determinar a contribuição de variáveis independentes 
Estabelecer modelo de julgamentos de consumidor 
Definir os elementos totais de utilidade total 
Identificar os critérios-chave de decisão 


Estágio 2 


Seis atributos ou menos 


Escolha de uma metodologia conjunta 
Quantos atributos devem ser usados? 


Menos de10 atributos 


10 ou mais atributos 


t 


Análise conjunta baseada 
em escolha 


Análise conjunta tradicional 


Planejamento de estímulos: 
Seleção e definição de fatores e níveis 


Escolha adaptativa 


Comunicáveis 
Acionáveis 


Características gerais Questões de especificação de fatores Questões de especificação de níveis 
Número de fatores 
Multicolinearidade de fatores 


Número equilibrado 
Amplitude 


FIGURA 7-1 


Definição da utilidade total do objeto 


O pesquisador deve primeiramente se assegurar de defi- 
nir a utilidade total do objeto. Para representar o proces- 
so de julgamento do respondente com precisão, todos os 
atributos que potencialmente criam ou diminuem a uti- 
lidade geral do produto ou serviço devem ser incluídos. 
É essencial que tanto fatores positivos quanto negativos 
sejam considerados pelos seguintes motivos: 


e Concentrar-se apenas em fatores positivos irá distorcer se- 
riamente os julgamentos dos respondentes. 

e Os respondentes podem empregar subconscientemente os 
fatores negativos, mesmo quando não fornecidos, e assim 
tornar o experimento inválido. 


Por exemplo, se grupos exploratórios são emprega- 
dos para avaliar os tipos de características consideradas 


Planejamento de estímulos: 
Especificação da forma do modelo básico 
A regra de composição: aditiva versus interativa 


A relação de utilidade parcial: linear, quadrática 
ou utilidades parciais separadas 


Estágios 1-3 do diagrama de decisão da análise conjunta. (Continua) 


quando avaliamos o objeto, o pesquisador deve se asse- 
gurar em tratar daquilo que torna o objeto desinteressan- 
te, bem como daquilo que o torna atraente. Felizmente, 
a omissão de um único fator tem apenas um pequeno 
impacto sobre as estimativas para outros fatores quan- 
do se usa um modelo aditivo [84], mas a omissão de um 
atributo-chave pode ainda assim distorcer seriamente a 
representação da estrutura de preferência e diminuir a 
precisão preditiva. 


Especificação dos fatores determinantes 


Além disso, o pesquisador deve se certificar de incluir to- 
dos os fatores determinantes (obtidos do conceito de atri- 
butos determinantes [5]). A meta é incluir os fatores que 
diferenciam melhor entre os objetos. Muitos atributos po- 
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Coleta de dados: 
Escolha de um método de apresentação 


Quais tipos de estímulos serão usados? 


Matriz de trocas Perfil completo Comparação pareada 


Coleta de dados: 
Criação de estímulos 


Desenvolver matrizes de troca 


Coleta de dados: 
Criação dos estímulos 


O respondente avaliará todos os estímulos ou 
apenas um subconjunto dos mesmos? 


Todos os estímulos 
Planejamento fatorial Planejamento fatorial fracionário 


Subconjunto de estímulos 


Ortogonalidade 
Balanço 


Coleta de dados: 
Seleção de uma medida de preferência 


Métrica (avaliações) versus não-métrica 
(ordenações) 


Coleta de dados: 
Forma de administração de levantamento 


Entrevistas pessoais 
Pesquisas por correio 
Pesquisas por telefone 


Estágio 3 Suposições 


Adequação da forma do modelo 
Representatividade da amostra 


Para o 
estágio 
4 


FIGURA 7-1 Continuação. 
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REGRAS PRÁTICAS 7-1 


Objetivos da análise conjunta 


e A análise conjunta é única em relação a outras técnicas 

multivariadas, pois: 

e É uma forma de modelo decomposicional que tem 
muitos elementos de um experimento 
Clientes fornecem apenas uma avaliação geral de 
preferências para objetos (estímulos) criados pelo 
pesquisador 
Estímulos são criados por combinação de um nível 
(valor) de cada fator (atributo) 
Cada respondente avalia estímulos o suficiente de 
forma que resultados conjuntos são estimados para 
cada indivíduo 


e Uma análise conjunta "bem-sucedida" requer que o 
pesquisador: 
e Defina precisamente todos os atributos (fatores) que 
têm impactos positivos e negativos sobre preferência 
e Aplique o modelo apropriado sobre como os clientes 
combinam os valores de atributos individuais em 


avaliações gerais de um objeto 
e Os resultados de análise conjunta podem ser usados 

para: 

e Fornecer estimativas da "utilidade" de cada nível 
dentro de cada atributo 
Definir a utilidade total de quaisquer estímulos 
de forma que possam ser comparados com outros 
estímulos para se prever escolhas de clientes (p.ex., 
participação de mercado) 


dem ser considerados importantes, mas também podem 
não diferenciar as escolhas, pois não variam substancial- 
mente entre os objetos. 


Por exemplo, a segurança em automóveis é um atributo 
importante, mas pode não ser determinante na maioria 
dos casos porque todos os carros atendem a padrões fede- 
rais rigorosos e, portanto, são considerados seguros, pelo 
menos em um nível aceitável. No entanto, outras caracte- 
rísticas, como quilômetros por litro, desempenho ou pre- 
ço, são importantes e muito mais prováveis de serem usa- 
das para se decidir entre diferentes modelos de carros. 


O pesquisador sempre deve se empenhar em identifi- 
car as variáveis-chave determinantes, porque elas são es- 
tratégicas na verdadeira decisão de julgamento. 


ESTÁGIO 2: O PROJETO DE 
UMA ANALISE CONJUNTA 


Tendo resolvido as questões relativas aos objetivos da pes- 
quisa, o pesquisador desvia sua atenção para as questões 


particulares envolvidas no delineamento e na execução do 
experimento de análise conjunta. Como descrito na seção 
introdutória, o pesquisador deve encarar diversas ques- 
tões sobre planejamento da pesquisa: 


e Primeiro, qual dentre os diversos métodos conjuntos alter- 
nativos deve ser escolhido? A análise conjunta tem três mé- 
todos diferentes para coletar e analisar dados, cada um com 
vantagens e limitações específicas. 

e Com o tipo de modelo selecionado, a próxima questão 
foca a composição e o delineamento dos estímulos. Quais 
são os fatores e níveis a serem usados para se definir uti- 
lidade? Como eles são combinados nos estímulos? Essas 
questões são críticas para o sucesso de qualquer análise 
conjunta. 

e Um benefício importante da análise conjunta é sua habi- 
lidade para representar muitos tipos de relações na variá- 
vel estatística conjunta. Uma consideração crucial é o tipo 
de efeitos que devem ser incluídos, pois eles demandam 
modificações no planejamento da pesquisa. Efeitos prin- 
cipais, representando o impacto direto de cada atributo, 
podem ser aumentados por efeitos de interação, os quais 
representam o impacto ímpar de várias combinações de 
atributos. 

e Aúltima questão se refere à coleta de dados, especificamen- 
te o tipo de medida de preferência a ser empregado e as 
tarefas reais enfrentadas pelo respondente. 


Devemos observar que as questões de delineamento 
talvez sejam a fase mais importante na análise conjunta. 
Um estudo mal planejado não pode ser “salvo” depois de 
aplicado se forem descobertas falhas. Assim, o pesquisa- 
dor deve prestar atenção especial aos problemas que cer- 
cam a construção e administração do experimento con- 
junto. 


Seleção de uma metodologia 
de análise conjunta 


Depois que o pesquisador determina os atributos básicos 
que constituem a utilidade do produto ou serviço (obje- 
to), uma questão fundamental deve ser resolvida: qual das 
três metodologias conjuntas básicas (tradicional, adaptati- 
va ou baseada em escolha) deve ser usada [74]? 

A escolha de metodologias conjuntas gira em torno 
das características básicas da pesquisa proposta: número 
de atributos com os quais se lida, nível de análise, tarefa 
de escolha, e forma de modelo permitida. A Tabela 7-5 
compara as três metodologias com relação a essas consi- 
derações. 


e A análise conjunta tradicional, ilustrada no exemplo an- 
terior, é caracterizada por um modelo aditivo simples que 
contém até nove fatores estimados para cada indivíduo. 
Um respondente avalia estímulos construídos com níveis 
selecionados de cada atributo (conhecidos como perfis com- 
pletos). Apesar de esse formato ter sido a principal base de 
estudos conjuntos por muitos anos, duas metodologias adi- 
cionais foram desenvolvidas na tentativa de lidar com certas 
questões de delineamento. 
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e O método conjunto adaptativo foi desenvolvido para aco- 
modar um grande número de fatores (muitas vezes acima 
de 30) que não seriam praticáveis em análise conjunta tra- 
dicional. Ele emprega um processo computadorizado que 
adapta os estímulos mostrados a um respondente à medida 
que a tarefa de escolha prossegue. Além disso, os estímulos 
podem ser compostos de subconjuntos de atributos, permi- 
tindo assim muitos atributos a mais. 

e O método da abordagem baseada em escolha emprega uma 
única forma para apresentar estímulos em conjuntos (esco- 
lher um de um conjunto de estímulos) no lugar de um por 
um. Devido à tarefa mais complicada, o número de fatores 
incluídos é mais limitado, mas a abordagem permite a inclu- 
são de interações e pode ser estimada no nível agregado ou 
individual. 


Muitas vezes, os objetivos de pesquisa criam situações 
com as quais a análise conjunta tradicional não lida bem, 
mas essas metodologias alternativas podem ser usadas. Os 
problemas de estabelecer o número de atributos e selecio- 
nar a forma do modelo são discutidos com mais detalhes 
na seção a seguir, que se concentra na análise conjunta 
tradicional. Depois, as únicas características das outras 
duas metodologias são abordadas em seções subsegiien- 
tes. O pesquisador deve notar que os problemas básicos 
discutidos nesta seção também se aplicam às outras duas 
metodologias. 


Planejamento de estímulos: seleção 
e definição de fatores e níveis 


Os fundamentos experimentais da análise conjunta atri- 
buem grande importância ao delineamento dos estímulos 
avaliados por respondentes. O delineamento envolve a 
especificação da variável estatística conjunta, selecionan- 
do os fatores e níveis a serem incluídos na construção de 
estímulos. Outras questões se relacionam com o caráter 
geral dos fatores, e níveis e considerações são específicos 
aos mesmos. Esses problemas de delineamento são im- 
portantes porque afetam a efetividade dos estímulos na 
tarefa, a precisão dos resultados e, finalmente, sua rele- 
vância administrativa. 


Características gerais de fatores e níveis 

Antes de discutir as questões específicas sobre fatores ou 
níveis, as características aplicáveis à especificação de fato- 
res e níveis devem ser abordadas. Quando se operaciona- 
lizam fatores ou níveis, o pesquisador deve garantir que as 
medidas sejam comunicáveis e acionáveis. 


Medidas comunicáveis. Primeiro, os fatores e níveis de- 
vem ser facilmente comunicados para uma avaliação rea- 
lista. Métodos tradicionais de administração (lápis e papel 
ou computador) limitam os tipos de fatores que podem 
ser incluídos. Por exemplo, é difícil descrever a verdadeira 
fragrância de um perfume ou a “sensação” de uma loção. 
Descrições escritas não capturam bem os efeitos senso- 
riais, a não ser que o respondente pegue o produto, inale a 
fragrância ou use a loção. Se respondentes estão incertos 
quanto à natureza dos atributos sendo usados, então os 
resultados não são um reflexo verdadeiro de sua estrutura 
de preferência. 

Uma tentativa de trazer uma descrição mais realista 
de características sensoriais que possam ter sido excluídas 
no passado envolve formas específicas de análise conjun- 
ta desenvolvidas para empregar realidade virtual [83] ou 
ajustar todo o domínio de efeitos sensoriais e de multimí- 
dia para descrever o produto ou serviço [43, 57, 94]. In- 
dependentemente de essas abordagens serem utilizadas, 
o pesquisador sempre deve estar comprometido com a 
comunicabilidade dos atributos e níveis usados. 


Medidas acionáveis. Os fatores e níveis também devem 
ter condições de ser colocados em prática, o que signifi- 
ca que os atributos devem ser distintos e representar um 
conceito que possa ser implementado precisamente. 


e Eles não devem ser atributos que sejam difíceis de especifi- 
car, como qualidade geral ou conveniência. Um aspecto fun- 
damental da análise conjunta é que respondentes negociam 
entre atributos, fazendo comparações entre atributos para 
avaliar um estímulo. Se eles não têm certeza sobre como um 
atributo se compara com outro (p.ex., um que seja definido 
de maneira mais precisa), então a tarefa não pode refletir a 
estrutura de preferência real. 


TABELA 7-5 Uma comparação de metodologias conjuntas alternativas 


Metodologia conjunta 


Característica Tradicional Adaptativa/Híbrida Baseada em escolhas 
Número máximo 9 30 6 
de atributos 
Nível de análise Individual Individual Agregado ou individual 
Forma do modelo Aditiva Aditiva Aditiva + Interação 


Tarefa de escolha Avaliação de estímulos 
de perfil completo um 


por vez 


Formato da coleta 
de dados 


Qualquer formato 


Avaliação de estímulos Escolha entre conjuntos 


contendo subconjuntos de estímulos 
de atributos 
Geralmente computacional Qualquer formato 
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e Os níveis não devem ser especificados em termos imprecisos, 
como baixo, moderado ou alto. Especificações como essas 
são imprecisas por causa das diferenças de percepção entre 
indivíduos quanto ao que elas realmente significam (quando 
comparadas com diferenças reais no que diz respeito ao que 
os indivíduos sentem com relação a elas). 

e Finalmente, conceitos ou atributos hipotéticos muitas vezes 
não são formalmente especificados, mas dados em termos de 
benefícios. Apesar de a análise conjunta poder representá-los 
para o respondente, o pesquisador deve se sentir confiante de 
que os respondentes compreendam como tais atributos de- 
sempenham individualmente e o que o produto final acarre- 
tará. Com muita fregiiência o estímulo é definido em termos 
vagos e não-familiares, de modo que nem o pesquisador, nem 
o respondente estão verdadeiramente seguros sobre o que é o 
produto ou o serviço final sob avaliação por parte do último. 


Se fatores não podem ser definidos mais precisamente, 
o pesquisador pode usar um processo de dois estágios. Um 
estudo conjunto preliminar define estímulos em termos de 
fatores mais globais ou vagos (qualidade ou conveniên- 
cia). Então, os fatores identificados como importantes no 
estudo preliminar são incluídos no estudo maior em ter- 
mos mais precisos. 


Questões de especificação relacionadas a fatores 
Após ter selecionado os atributos a serem incluídos como 
fatores e garantido que as medidas serão comunicáveis e 
acionáveis, o pesquisador ainda deve abordar três ques- 
tões específicas para definir fatores: o número de fatores a 
serem incluídos, a multicolinearidade entre os mesmos e o 
papel único do preço como um fator. 


Número de fatores. O número de fatores incluídos na 
análise afeta diretamente a eficiência estatística e a con- 
fiabilidade dos resultados. Dois limites entram em jogo 
quando se considera o número de fatores a serem incluí- 
dos no estudo: 


1. Acrescentar fatores a um estudo conjunto sempre aumenta 
o número mínimo de estímulos no planejamento conjunto. 
O número mínimo de estímulos que devem ser avaliados 
por um respondente é 


Número mínimo de estímulos = Número total de níveis por 
todos os fatores — Número de fatores + 1 


Por exemplo, uma análise conjunta com cinco fatores 
com três níveis cada (um total de 15 níveis) precisaria de 
um mínimo de onze (15 — 5 + 1) estímulos. 


Tal exigência é semelhante àquelas encontradas em re- 
gressão quando o número de observações deve exceder o 
número de coeficientes estimados. Um planejamento con- 
junto com apenas um par de fatores é relativamente sim- 
ples, mas o acréscimo de fatores pode rapidamente torná-lo 
uma tarefa complexa e árdua para o respondente. 

Ainda que possa parecer que o aumento no número de 
fatores reduza o número de estímulos exigido (ou seja, o nú- 


mero de fatores é subtraído na equação anterior), lembre-se 
que cada fator deve ter pelo menos dois níveis (e muitas ve- 
zes mais), de modo que um fator adicional sempre aumenta 
o número de estímulos. Assim, no exemplo anterior, acres- 
centar um fator a mais com três níveis demanda pelo menos 
dois estímulos extras. 

Há evidências de que técnicas tradicionais de análise 
conjunta podem empregar um número maior de atributos 
(20 ou algo perto disso) do que se pensou originalmente 
[82]. Como discutimos adiante, algumas técnicas foram de- 
senvolvidas para lidar especificamente com grandes quan- 
tias de atributos com delineamentos especializados. Mesmo 
em tais situações, o pesquisador é advertido a garantir que, 
não importa quantos atributos sejam incluídos, isso não re- 
presente uma tarefa complexa para o respondente. 

2. Quando se modela uma relação mais complexa, como no 
caso de acréscimo de termos de interação, estímulos adi- 
cionais são exigidos. Algumas reduções nos estímulos são 
viáveis por meio de planejamentos conjuntos especializa- 
dos, mas o número maior de parâmetros a serem estimados 
demanda um número maior de estímulos ou uma diminui- 
ção na confiabilidade dos parâmetros. 


É especialmente importante observar que a análise 
conjunta difere de outras análises multivariadas no sen- 
tido de que aumento na complexidade do modelo e as 
correspondentes exigências de dados não podem ser re- 
mediadas acrescentando-se mais respondentes. Em aná- 
lise conjunta, cada respondente gera o número requerido 
de observações, e assim o número exigido de estímulos 
é constante, não importando quantos respondentes são 
analisados. Formas especializadas de estimação estimam 
modelos agregados ao longo de indivíduos, exigindo as- 
sim menos estímulos por respondente, mas nesses casos 
o conceito fundamental de se obter estimativas conjun- 
tas para cada respondente é eliminado. Discutimos tais 
opções com mais detalhes em uma seção adiante. 

A especificação de fatores também é uma fase críti- 
ca do planejamento da pesquisa: uma vez que um fator 
é incluído na tarefa de escolha de uma análise conjunta, 
ele não pode simplesmente ser removido da análise. Res- 
pondentes sempre avaliam conjuntos de atributos cole- 
tivamente. A remoção de um atributo na estimação das 
utilidades parciais invalida a análise conjunta. 


Multicolinearidade fatorial. Um problema que muitas ve- 
zes passa não detectado, a não ser que o pesquisador exami- 
ne cuidadosamente todos os estímulos na análise conjunta, é 
a correlação entre fatores (conhecida como correlação inte- 
ratributos ou ambiental). Em termos práticos, a presença de 
fatores correlacionados denota uma falta de independência 
conceitual entre os fatores. Primeiro examinamos os efeitos 
de correlação interatributos sobre o planejamento conjunto, 
e em seguida discutimos várias ações corretivas. 


Impactos da correlação interatributos. Quando 
dois ou mais fatores são correlacionados, dois resultados 
diretos ocorrem: 
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1. As estimativas de parâmetros são afetadas como na regres- 
são (o Capítulo 4 contém uma discussão sobre a multicoli- 
nearidade e seu impacto). Entre os efeitos mais problemá- 
ticos está a incapacidade de se obter estimativas confiáveis 
devido à falta de unicidade para cada nível. 

2. Talvez mais importante seja a criação de combinações ina- 
creditáveis de dois ou mais fatores que podem distorcer o 
planejamento conjunto. Este problema ocorre tipicamente 
em duas situações: 


retidos, o pesquisador tem três ações corretivas básicas 
para contornar os estímulos não-realistas incluídos no 
planejamento conjunto: 


1. 


A ação mais direta é criar superatributos que combinem os 
aspectos de atributos correlacionados. Aqui o pesquisador 
considera os dois fatores e cria novos níveis que represen- 
tam quantias realistas de ambos. 


e Primeiro, dois atributos estão negativamente correlacio- 
nados, de modo que os clientes esperam que elevados 
níveis de um fator devam coincidir com baixos níveis de 
outro. No entanto, quando níveis de cada um são combi- 
nados na tarefa conjunta, os estímulos não são realistas. 


Um exemplo simples envolve potência e quilômetros por 
litro de gasolina. Apesar de os atributos serem válidos 
quando considerados em separado, muitas combinações 
de seus níveis carecem de sentido. Qual é o realismo de um 
automóvel com os mais altos níveis de potência e quilôme- 


Em nosso exemplo de potência e quilômetros por litro de 
gasolina, talvez um fator de “desempenho” possa ser usado 
como substituto. Neste caso, níveis de desempenho podem 
ser definidos em termos de potência e quilômetros por li- 
tro, mas como combinações realistas em um único fator. 
Como um exemplo de atributos positivamente corre- 
lacionados, fatores de organização de loja, iluminação e 
decoração podem ser melhor representados por um único 
conceito, como “atmosfera da loja”. Esta designação fa- 
torial evita os estímulos irreais de elevados níveis de or- 
ganização e iluminação, mas baixos níveis de decoração 
(juntamente com outras combinações igualmente inacre- 


tros por litro? Além disso, por que alguém consideraria 
um carro com os mais baixos níveis desses dois atributos? 


O problema não está nos níveis propriamente, mas 
no fato de que eles não podem ser pareados realistica- 
mente em todas as combinações, o que é exigido na esti- 
mação de parâmetros. 

e A segunda situação acontece quando um fator aponta 
para a presença/ausência de uma característica e outro 
atributo indica quantia. Nesta situação, a tarefa conjunta 
inclui estímulos denotando que uma característica está 
disponível/indisponível, com um segundo fator mostran- 
do quanto. 


Um exemplo simples envolve dois fatores, com o primei- 
ro indicando a presença/ausência de um desconto em um 
preço e o segundo fator apontando para o montante do 
desconto. O problema surge sempre que os estímulos são 
construídos para indicar a ausência de um desconto, ape- 
sar de o segundo fator especificar uma quantia. Incluir 
um nível com o valor zero apenas aumenta o problema, 
pois agora estímulos incluídos podem apontar para um 
desconto de zero. O resultado em cada situação é um 
estímulo nada plausível. 


Novamente em tal situação, cada fator é plausível quando 
considerado separadamente, entretanto, quando combinados, 
criam estímulos que não são possíveis e não podem ser usados 
na análise. 


Ações corretivas para correlação interatribu- 
tos. Ainda que um pesquisador goste sempre de evitar 
uma correlação ambiental entre fatores, em alguns casos 
os atributos são essenciais para a análise conjunta e de- 
vem ser incluídos. Quando os fatores correlacionados são 


ditáveis). 


outro que aponta quantia, a abordagem mais direta é com- 
biná-los em um só fator, com os níveis incluindo zero para 
indicar a ausência do atributo. 


Quando um fator de ausência/presença é utilizado com 


É importante observar que quando esses superatributos 
são acrescentados, eles devem ser tão acionáveis e específi- 
cos quanto possível. Se não é possível definir os fatores mais 
amplos com o nível necessário de especificidade, então os 
pesquisadores podem ser forçados a eliminar um dos fatores 
originais do planejamento. 

Uma segunda opção envolve planejamentos experimentais 
refinados e técnicas de estimação que criam estímulos quase 
ortogonais, que podem ser usados para eliminar qualquer 
estímulo inacreditável resultante de correlação interatribu- 
tos [102]. Aqui o pesquisador pode especificar quais com- 
binações de níveis (conhecidas como pares proibidos) ou 
mesmo estímulos do planejamento ortogonal devem ser eli- 
minados do planejamento conjunto, apresentando assim aos 
respondentes apenas estímulos críveis. Contudo, o perigo 
nesta abordagem é que estímulos pobremente delineados 
resultam em um número tão grande de estímulos inacei- 
táveis que um ou mais fatores correlacionados são efetiva- 
mente eliminados do estudo, o que afeta então as estimati- 
vas de utilidades parciais para os mesmos e todos os demais 
fatores. 

A terceira ação corretiva é restringir a estimação de utilida- 
des parciais para obedecer a uma relação pré-especificada. 
Essas restrições podem ser entre fatores, bem como perten- 
cer aos níveis dentro de qualquer fator [100, 106]. Novamen- 
te, porém, o pesquisador está colocando restrições sobre o 
processo de estimação, o que pode produzir estimativas po- 
bres das estruturas de preferência. 


A presença de uma correlação interatributos é uma 


questão que deve ser abordada em qualquer análise con- 
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junta. Dentre as três ações corretivas discutidas, a criação 
de superatributos é a técnica conceitualmente superior, 
pois ela preserva a estrutura básica da análise conjunta. 
As outras duas ações corretivas, que acrescentam signi- 
ficante complexidade ao delineamento e à estimação da 
análise, devem ser consideradas somente depois que a 
ação mais direta tenha sido tentada. 


O papel único do preço como um fator. O preço é um 
fator incluído em muitos estudos conjuntos por represen- 
tar uma componente distinta de valor para muitos produ- 
tos ou serviços que são estudados. O preço, porém, não é 
como outros atributos em suas relações com outros fato- 
res [50]. Primeiro discutimos os aspectos únicos do preço, 
e então tratamos das abordagens para a inclusão do preço 
em uma análise conjunta. 

Preço é um elemento principal em qualquer avaliação 
de valor, e assim, um atributo idealmente adequado à na- 
tureza de troca da análise conjunta. Porém, é esta natu- 
reza básica de ser uma troca inerente que cria diversos 
problemas com sua inclusão: 


e Em muitos casos, se não for na maioria, o preço tem um 
grau elevado de correlação interatributos com outros fato- 
res. Para muitos atributos, um aumento na quantia do atri- 
buto é associado com um aumento de preço, e uma queda 
no nível de preço pode não ser realista. O resultado é um ou 
mais estímulos que são inadequados para inclusão na análi- 
se conjunta (ver discussão anterior sobre correlação intera- 
tributos para possíveis ações corretivas). 

e A relação preço-qualidade pode ser operante entre certos 
fatores, de modo que algumas combinações talvez sejam 
não-realistas ou tenham as percepções não-pretendidas. 
Esta forma específica de correlação interatributos é uma 
consideração-chave em muitas aplicações de análise con- 
junta. 

e Muitos outros fatores positivos (p.ex., qualidade, confia- 
bilidade) podem ser incluídos ao se definir a utilidade do 
produto ou serviço. No entanto, quando se define do que 
se abre mão para essa utilidade (ou seja, preço), apenas um 
fator é incluído, o que pode diminuir inerentemente a im- 
portância do preço [77]. 

e Finalmente, o preço pode interagir com outros fatores, 
particularmente fatores mais intangíveis, como nome 
da marca. O impacto de uma interação nessa situação é 
que um certo nível de preço tem diferentes significados 
para diferentes marcas [50, 77], um aplicável a uma marca 
premium e outro a uma marca de desconto. Discutimos o 
conceito de interações posteriormente neste capítulo. 


Todas essas características únicas do preço como um 
fator não devem fazer com que o pesquisador evite o uso 
deste atributo, mas que, em vez disso, antecipe os impac- 
tos e ajuste o delineamento e a interpretação como exigi- 
do. Primeiro, formas explícitas de análise conjunta, como 
análise de valor conjunta (CVA), foram desenvolvidas 
para ocasiões nas quais o foco é o preço [92]. Além dis- 
so, se as interações de preço e outros fatores são consi- 
deradas importantes, métodos como as análises conjuntas 


REGRAS PRÁTICAS 7-2 


Delineamento de uma tarefa conjunta 


e Pesquisadores devem escolher uma das três 
metodologias com base no número de atributos, nas 
exigências da tarefa de escolha e no modelo assumido 
de escolha do cliente: 

e Métodos tradicionais são mais adequados quando 
o número de atributos é menor que 10, resultados 
são desejados para cada indivíduo, e o modelo mais 
simples de escolha do cliente é aplicável 
Métodos adaptativos são mais apropriados quando 
quantias maiores de atributos estão envolvidas (até 
30), mas demandam entrevistas computadorizadas. 
Métodos baseados em escolhas são considerados 
os mais realistas, podem elaborar modelos mais 
complexos de escolha por parte de clientes, e têm 
se tornado mais populares; mas geralmente são 
limitados a seis ou menos atributos 

O pesquisador encara uma troca fundamental no 

número de fatores incluídos: 

e Aumentá-los para refletir melhor a "utilidade" do 
objeto versus 
Minimizá-los para reduzir a complexidade da 
tarefa conjunta do respondente e permitir o uso de 
qualquer um dos três métodos 

A especificação de fatores (atributos) e níveis (valores) 


de cada fator deve garantir que: 

e Fatores e níveis são influências distintas sobre a 
preferência, definidos em termos objetivos com 
ambigiidade mínima, eliminando assim elementos 
emocionais ou estéticos 


Fatores geralmente têm o mesmo número de níveis 
Correlações interatributos (p.ex., aceleração e 
quilômetros por litro) podem estar presentes a níveis 
mínimos (0,20 ou menos) para realismo, mas níveis 
maiores devem ser acomodados pela: 

e Criação de um "superatributo" (como 
desempenho) 

Especificação de pares proibidos na análise para 
eliminar estímulos não-realistas (como aceleração 
rápida e notável rendimento de litro) 
Restrição da estimação do modelo para se 
adequar a relações pré-especificadas 

e Preço demanda especial atenção, pois: 

e Geralmente tem correlações interatributos com a 
maioria dos demais fatores (p.ex., relação preço- 
qualidade) 

Em muitas situações representa de forma ímpar o 
que é negociado em custo para o objeto 
Interações substanciais com outras variáveis 
podem exigir métodos conjuntos baseados em 
escolha ou multiestágios 


baseadas em escolha ou as de multiestágio [77, 81, 112] 
fornecem estimativas quantitativas dessas relações. Mes- 
mo que nenhum ajuste específico seja feito, o pesquisador 
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deve considerar essas questões na definição de níveis de 
preço e na interpretação dos resultados. 


Questões de especificação referentes a níveis 

A definição de níveis é um aspecto crítico da análise con- 
junta, pois os níveis são as verdadeiras medidas usadas 
para formar os estímulos. Assim, além de serem acioná- 
veis e comunicáveis, a pesquisa tem mostrado que o nú- 
mero de níveis, o equilíbrio de níveis entre fatores e os 
intervalos dos níveis em um fator têm efeitos diferentes 
sobre as avaliações dos respondentes. 


Número equilibrado de níveis. Os pesquisadores devem 
tentar equilibrar ou equalizar o melhor possível o núme- 
ro de níveis nos fatores. A importância relativa estimada 
de uma variável tende a aumentar quando o número de 
níveis cresce, mesmo quando os pontos extremos perma- 
necem os mesmos [52, 71,110, 117, 118]. Conhecida como 
o “número de efeitos de níveis”, a categorização refinada 
chama a atenção para os atributos e faz com que os con- 
sumidores se concentrem naquele fator mais do que nos 
outros. Se a importância relativa de fatores é conhecida 
a priori, então o pesquisador pode querer expandir os ní- 
veis dos fatores mais importantes para evitar uma diluição 
de importância e captar informação adicional sobre os fa- 
tores mais importantes [116]. 


Intervalo dos níveis fatoriais. O intervalo (de pequeno 
a grande) dos níveis deve ser estabelecido um pouco fora 
dos valores existentes, mas não em um nível inacreditá- 
vel. Tal prática ajuda a reduzir a correlação interatribu- 
tos, mas também pode reduzir a credibilidade; portanto, 
os níveis não devem ser muito extremos. Nunca extrapo- 
le além dos níveis mais externos [77], pois você não pode 
estar tão certo sobre como o respondente irá responder a 
estes níveis. Níveis completamente inaceitáveis também 
podem causar problemas substanciais e devem ser elimi- 
nados. 

Antes de excluir um nível, porém, o pesquisador deve 
assegurar-se de que elas seja verdadeiramente inaceitável, 
pois muitas vezes as pessoas escolhem produtos ou ser- 
viços que têm o que elas chamam de níveis inaceitáveis. 
Se um nível inaceitável é encontrado depois que o experi- 
mento foi administrado, as soluções recomendadas são a 
eliminação de todos os estímulos que têm níveis inaceitá- 
veis ou a redução de estimativas de utilidades parciais do 
nível transgressor a um ponto em que quaisquer objetos 
que contenham aquele nível não serão escolhidos. 

O pesquisador também deve aplicar os critérios de re- 
levância prática e aplicabilidade ao definir os níveis. Níveis 
que não são práticos ou jamais seriam usados em situações 
realistas podem afetar artificialmente os resultados. 


Por exemplo, considere que no curso normal de negó- 
cios o intervalo de preços varie cerca de 10% em tor- 


no do preço médio de mercado. Se um nível de preço 
20% inferior fosse incluído, mas na realidade não fosse 
oferecido, sua inclusão distorceria os resultados sensi- 
velmente. Os respondentes seriam logicamente mais 
favoráveis a um nível de preço como esse. Quando as 
estimativas de utilidades parciais são feitas e a impor- 
tância do preço é calculada, o preço parecerá artificial- 
mente mais importante do que realmente seria em de- 
cisões diárias. 


O pesquisador deve usar os critérios de aplicabilidade 
e relevância prática em todos os níveis de atributo para 
garantir que não sejam criados estímulos que serão favo- 
ravelmente vistos pelo respondente mas que jamais terão 
uma chance real de ocorrer. 


Especificação da forma do modelo básico 


Para a análise conjunta explicar a estrutura de preferência 
de um respondente apenas a partir de avaliações gerais de 
um conjunto de estímulos, o pesquisador deve tomar duas 
decisões-chave referentes ao modelo de análise conjunta 
inerente: especificar a regra de composição a ser empre- 
gada e selecionar o tipo de relações entre estimativas de 
utilidades parciais. Essas decisões afetam tanto o delinea- 
mento dos estímulos quanto a análise das avaliações do 
respondente. 


A regra de composição: seleção de um 

modelo aditivo versus interativo 

A decisão mais abrangente do pesquisador envolve a es- 
pecificação da regra de composição do respondente. A re- 
gra de composição descreve como o respondente combina 
as utilidades parciais dos fatores para obter utilidade ge- 
ral. É uma decisão crítica, pois define a natureza básica da 
estrutura de preferência que será estimada. Na próxima 
seção discutimos os elementos básicos da regra de compo- 
sição mais comum — o modelo aditivo — e então tratamos 
das questões envolvidas na adição de outras formas de re- 
lações de utilidades parciais conhecidas como termos de 
interação. 


O modelo aditivo. A regra de composição mais comum 
e básica é um modelo aditivo. Este considera que o res- 
pondente simplesmente soma os valores para cada atri- 
buto (as utilidades parciais dos níveis) para obter o valor 
total para uma combinação de atributos (produtos ou ser- 
viços). Fazendo isso, a utilidade total de qualquer estímu- 
lo definido pode ser calculada como a soma das partes. 


Por exemplo, considere que um produto tem dois fatores (1 
e 2), cada um com dois níveis (A, Be €, D). As utilidades 
parciais do fator 1 foram estimadas em 2 e 4 (níveis A e B), 
enquanto o fator 2 apresenta valores de utilidades parciais 


(Continua) 
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(Continuação) 
de3e5 (níveis Ce D). Podemos então calcular a utilidade 
total dos quatro possíveis estímulos como se segue: 


Utilidades par- 
Níveis definin- ciais do modelo  Utilida- 
Estímulo do estímulo aditivo de total 
1 AeC 2+43 5 
2 AeD 2+5 7 
3 BeC 4+3 7 
4 BeD 4+5 9 


O modelo aditivo tipicamente explica a maior parte 
(até 80 ou 90%) da variação em preferência na maioria 
dos casos, e é suficiente para a maioria das aplicações. É 
também o modelo básico inerente tanto à análise conjun- 


ta tradicional quanto à adaptativa (ver Tabela 7-5). 


Acréscimo de efeitos de interação. A regra de composi- 
ção que usa efeitos de interação é parecida com a forma 
aditiva, no sentido de que o consumidor soma as utilida- 
des parciais para obter um total geral no conjunto de atri- 
butos. Ela é um pouco diferente, porque permite que cer- 
tas combinações de níveis estejam acima ou abaixo de sua 
soma. A regra de composição interativa corresponde à 
afirmação: “O todo é maior (ou menor) do que a soma de 
suas partes”. Revisitemos um de nossos primeiros exem- 
plos para ver como efeitos de interação afetam escores de 
utilidade. 


Em nosso exemplo de detergente industrial, examine- 
mos os resultados para o respondente 2 (rever Tabela 
7-4). Nas utilidades parciais estimadas, a marca Gené- 
rica foi preferida em detrimento da HBAT, sem fosfato 
foi preferido em relação aos ingredientes baseados em 
fosfato, e líquido foi preferido no lugar de pó. 

Mas os resultados do respondente nem sempre são 
consistentes como neste caso. Como anteriormente dis- 
cutido, para os estímulos 5 a 8 o respondente sempre 
preferiu estímulos com a marca Genérica no lugar de 
HBAT, com todas as demais coisas mantidas constan- 
tes. Mas o inverso é verdadeiro com os estímulos 1 a 
4. O que diferencia esses dois conjuntos de estímulos? 
Olhando a Tabela 7-4, percebemos que os estímulos 1-4 


contêm a forma líquida, enquanto os estímulos 5-8 con- 
têm a forma de pó. Assim, parece que as preferências do 
respondente 2 quanto à marca diferem dependendo se 
o estímulo contém uma forma líquida ou em pó. Neste 
caso dizemos que os fatores Marca e Forma interagem, 
de forma que uma ou mais combinações desses fatores 
resultam em avaliações muito maiores ou menores do 
que o esperado. Sem a inclusão deste efeito de intera- 
ção ,as ordenações de preferência real e estimada não 
coincidirão. 


Desvantagens do acréscimo de termos de intera- 
ção. Coma habilidade dos termos de interação de acres- 
centar generalidade à regra de composição, por que não 
usar o modelo interativo em todos os casos? A adição de 
termos de interação tem algumas desvantagens que de- 
vem ser consideradas: 


e Cada termo de interação exige uma estimativa extra de uti- 
lidade parcial com pelo menos um estímulo adicional para 
cada respondente avaliar. A menos que o pesquisador saiba 
exatamente quais termos de interação estimar, o número de 
estímulos cresce dramaticamente. Além disso, se respon- 
dentes não utilizarem um modelo interativo, a estimação 
dos termos adicionais de interação na variável estatística 
conjunta reduz a eficiência estatística (mais estimativas de 
utilidades parciais) do processo de estimação e torna a tare- 
fa conjunta mais difícil. 

e Mesmo quando usadas por respondentes, interações pre- 
vêem substancialmente menos variância do que os efeitos 
aditivos, geralmente não excedendo 5-10% de aumento na 
variância explicada. Logo, em muitos casos, o poder prediti- 
vo aumentado será mínimo. 

e Termos de interação são geralmente substanciais em casos 
para os quais atributos são menos tangíveis, particularmen- 
te quando reações estéticas ou emocionais desempenham 
um papel significativo. 


O pesquisador deve equilibrar o potencial para expli- 
cação aumentada de termos de interação com as conse- 
quências negativas do acréscimo destes. O termo de in- 
teração é mais efetivo quando o pesquisador pode supor 
que porções "não-explicadas" de utilidade são associadas 
somente com certos níveis de um atributo. O Documento 
7-1 fornece um exame mais detalhado sobre como identi- 
ficar termos de interações e seus impactos sobre estimati- 
vas de utilidades parciais e precisão preditiva. 


Documento 7-1 Um exemplo de efeitos de interação sobre 
estimativas de utilidades parciais 


Interações são primeiramente identificadas por padrões 
ímpares dentro dos escores de preferência de um res- 
pondente. Se elas não forem incluídas no modelo adi- 
tivo, elas podem afetar sensivelmente a estrutura de 


preferência estimada. Retornamos ao nosso exemplo de 
um detergente industrial para ilustrar como interações 
são refletidas nos escores de preferência de um respon- 
dente. 
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Obtenção de avaliações de preferência er E 
pois os efeitos principais de marca e ingredientes são 


perturbados pelas interações mostradas pela inversão 


Em nosso exemplo anterior de um detergente industrial, de ordem de preferência quando a marca genérica foi 
podemos postular uma situação onde o respondente faz envolvida. 


escolhas nas quais aparecem interações para influenciar 
as escolhas. Considere que um terceiro respondente deu 
a seguinte ordem de preferência: 


O impacto se estende para as estimativas de utilidade 
parcial, como podemos ver pela maneira como também 


Ordenações de estímulos formados por três fatores afeta os escores de utilidade geral e as ordenações previs- 
(1 = mais preferido, 8 = menos preferido) tas para cada estímulo. 
Forma 


A tabela a seguir compara as ordens reais de preferência 


Líquido Pó É 
d com as ordens calculadas e previstas usando o modelo 


Marca Ingredientes aditivo. 
HBAT — ps : HBAT 
= ERA Sem fosfato Com fosfato 
Genérica Sem fosfato 7 8 TT , TT. 3 
Com fosfato g 6 Líquido Pó Líquido Pó 
Ordem real 1 2 5, 4 
Considere que a “verdadeira” estrutura de prefe- o 
a a ag Utilidade calculada 210 126 210 126 
rência para este respondente deve refletir uma pre- Ord ista” 15 35 15 35 
ferência pela marca HBAT, líquido sobre pó, e de- ? ú à j 
tergentes sem fosfato sobre aqueles que têm fosfato. Genérico 
Contudo, uma experiência ruim com um detergente Sem fosfato Com fosfato 
genérico fez o respondente selecionar aquele com fos- — 5 — 3 
fato no lugar do outro só se ele fosse de uma marca ge- Líquido Pó Líquido Pó 
nérica. Essa escolha vai contra as preferências gerais e Ordem real 7 8 5 6 
é refletida em um efeito de interação entre os fatores Utilidade calculada 1,26 2,10 1,26 2,10 
de marca e ingredientes. Ordem prevista” 55 75 55 75 
“Escores de utilidade maiores representam preferência 
maior e, assim, ordem maior. Além disso, as ordens empata- 
das são mostradas como ordem média (p.ex., dois estímulos 
Estimação do modelo conjunto empatados em 1 e 2 recebem a ordem 1,5). 
Se considerarmos apenas um modelo aditivo, obteremos As previsões são obviamente menos precisas, pois sa- 
as seguintes estimativas de utilidades parciais: bemos que existem interações. Se prosseguíssemos com 


apenas um modelo aditivo, estaríamos violando uma das 
principais suposições e fazendo previsões potencialmen- 
te muito imprecisas. 


Estimativas de utilidades parciais para o 
respondente 3: modelo aditivo 


Forma Ingredientes Marca 


Líquido Pó Sem Com  HBAT Genérico 
fosfato fosfato 


Identificação de interações 
Examinar interações de primeira ordem é uma tarefa ra- 


0,42 042 00 0,0 1,68 -1,68 ; k 
zoavelmente simples com dois passos. Usando o exemplo 
anterior com três fatores, ilustramos cada passo: 

Quando examinamos as estimativas de utilidades par- e Forme três matrizes de 2º ordem referentes à ordem de pre- 
ciais, percebemos que os valores foram perturbados pela ferência. Em cada matriz, some as duas ordens de preferên- 
interação. cia para o terceiro fator. 

Mais marcantemente ainda, os dois níveis no fator de Por exemplo, a primeira matriz pode ser as combina- 
ingredientes têm utilidades parciais iguais a 0,0, ainda ções de forma e ingredientes com cada célula contendo 
que saibamos que o respondente preferia na realidade a soma das duas preferências por marca. Ilustramos o 
a opção livre de fosfato. As estimativas são enganosas, processo com duas das possíveis matrizes aqui: iai) 
oninua 
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Matriz 1º Matriz 2 
Forma Ingredientes 
Marca Líquido Pó Semfosfato Com fosfato 
HBAT 1+3 2+4 1+2 3+4 


Genérico 7+5 8+6 7+8 5+6 


“Os valores são as duas ordens de preferência para Ingredientes. 
b = a . 
Os valores são as duas ordens de preferência para Forma. 


e Para checar as interações, os valores diagonais são então so- 
mados e a diferença é calculada. Se o total é zero, não existe 
interação. 


Para a matriz 1, as duas diagonais são iguais a 18 (1 +3 
+8+6=7+5+2+4). Mas na matriz 2 0 total nas diago- 
nais não é igual (1+2+5+627+8+3+4). Tal diferen- 
ça aponta para uma interação entre marca e ingredientes, 
como anteriormente descrito. O grau de diferença indica 
a força da interação. 

À medida que a diferença se torna maior, o impacto da 
interação aumenta, e fica a cargo do pesquisador quando 
as interações causam problemas de previsão o suficiente, a 
fim de assegurar a maior complexidade da estimação dos 
coeficientes devido aos termos de interação. 


Seleção do tipo de modelo. A escolha de uma regra de 
composição determina os tipos e o número de tratamen- 
tos ou estímulos que o respondente deve avaliar, junta- 
mente com a forma do método de estimação utilizado. 
Como anteriormente discutido, uma ponderação entre as 
duas abordagens precisa ser considerada. Uma forma adi- 
tiva exige menos avaliações do respondente, e é mais fácil 
obter estimativas para as utilidades parciais. No entanto, a 
forma interativa é uma representação mais precisa quan- 
do os respondentes usam regras mais complexas de deci- 
são na avaliação de um produto ou serviço. 

O pesquisador não sabe com certeza a melhor forma 
de modelo, mas deve, em vez disso, compreender as impli- 
cações de qualquer escolha sobre o delineamento de estu- 
do e sobre os resultados obtidos. Se uma forma de modelo 
aditivo é escolhida, não é possível estimar efeitos intera- 
tivos. Isso não significa que o pesquisador deva sempre 
incluir efeitos interativos, uma vez que eles acrescentam 
complexidade substancial ao processo de estimação e na 
maioria dos casos fazem com que a análise seja executa- 
da no nível agregado e não no individual. Examinamos 
a necessidade de se fazer essa escolha e as ponderações 
associadas à escolha de uma das formas em vários pontos 
de nossa discussão. 


Seleção da relação de utilidades parciais: linear, 
quadrática ou utilidades parciais separadas 

A flexibilidade da análise conjunta para lidar com dife- 
rentes tipos de variáveis vem das suposições que o pes- 


quisador faz referentes às relações das utilidades parciais 
dentro de um fator. Ao tomar decisões sobre a regra de 
composição, o pesquisador decide como os fatores se re- 
lacionam uns com os outros na estrutura de preferência 
do respondente. Ao definir o tipo de relação de utilidades 
parciais, o pesquisador se concentra em como os níveis de 
um fator estão relacionados. 


Tipos de relações de utilidades parciais. A análise con- 
junta dá ao pesquisador três alternativas, que variam da 
mais restrita (uma relação linear) até a menos restrita 
(utilidades parciais separadas), com o ponto ideal, ou mo- 
delo quadrático, entre essas duas. A Figura 7-2 ilustra as 
diferenças entre os três tipos de relações: 


e O modelo linear é o mais simples, ainda que seja a forma 
mais restrita, porque estimamos apenas uma utilidade par- 
cial (semelhante a um coeficiente de regressão), a qual é 
multiplicada pelo valor do nível para chegar a utilidades 
parciais separadas para cada nível. 

e Na forma quadrática, também conhecida como o modelo 
ideal, a suposição de linearidade estrita é relaxada, de modo 
que temos uma relação curvilínea simples. A curva pode ter 
concavidade para cima ou para baixo. 

e Finalmente, a forma de utilidades parciais separadas (em 
geral chamada simplesmente de forma de utilidades par- 
ciais) é a mais geral, permitindo estimativas separadas para 
cada nível. Quando usamos utilidades parciais separadas, 
o número de valores estimados é mais alto e aumenta ra- 
pidamente quando acrescentamos fatores e níveis, porque 
cada novo nível tem uma estimativa de utilidade parcial se- 
parada. 


A forma de relação de utilidades parciais pode ser es- 
pecificada para cada fator separadamente, e uma mistura 
de formas nos fatores é possível, se necessária. Essa es- 
colha não afeta o modo como os tratamentos ou estímu- 
los são criados, e valores das utilidades parciais ainda são 
calculados para cada nível. No entanto, isso tem impacto 
sobre como e quais tipos de utilidades parciais são estima- 
dos por análise conjunta. Se podemos reduzir o número 
de parâmetros estimados para qualquer conjunto dado de 
estímulos usando uma relação de utilidade parcial mais 
restrita (p.ex., uma forma linear ou quadrática), então 
os cálculos são mais eficientes e mais confiáveis sob um 
ponto de vista de estimação estatística. O impacto sobre o 
número de parâmetros estimados e eficiência estatística se 
relaciona diretamente ao tipo de relação escolhida: 


e Se as formas linear ou quadrática são especificadas, então os 
valores das utilidades parciais para cada nível são estimados 
a partir de uma relação. Uma relação linear requer a estima- 
tiva de um único coeficiente, enquanto a relação quadrática 
exige dois parâmetros. 

e Se especificarmos estimativas separadas de utilidades par- 
ciais, então o número de parâmetros se iguala ao de níveis. 


O pesquisador deve considerar o balanço entre os ga- 
nhos em eficiência estatística usando as formas linear ou 
quadrática versus a representação potencialmente mais 
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FIGURA 7-2 Três tipos básicos de relação entre níveis fatoriais em análise conjunta. 


precisa de como o cliente realmente forma preferência 
geral se empregamos relações menos restritivas de utili- 
dades parciais. 


Seleção de uma relação de utilidade parcial. O pesquisa- 
dor dispõe de diversas abordagens para decidir o tipo de 
relação para cada fator. 


e Primeiro, o pesquisador pode confiar em pesquisa anterior 
ou em modelos conceituais para ditar o tipo de relação. 
Deste modo, um pesquisador pode ser capaz de especificar 
uma relação linear ou quadrática para conquistar não ape- 
nas eficiência estatística, mas também consistência com a 
questão de pesquisa. 

e Se não estiver disponível suporte conceitual para especi- 
ficar a forma da relação, o pesquisador pode seguir uma 
abordagem mais empírica. Aqui o modelo conjunto é esti- 
mado primeiro como um modelo de utilidade parcial. Em 
seguida, as diferentes estimativas de utilidade parcial são 
examinadas visualmente para que se detecte se uma for- 
ma linear ou quadrática é adequada. Em muitos casos, a 
forma geral é clara, e o modelo pode ser reestimado com 
relações especificadas para cada variável conforme for 
justificado. 

e Finalmente, o pesquisador pode avaliar as mudanças na ha- 
bilidade preditiva sob diferentes combinações de relações 
para uma ou mais variáveis, selecionando a relação que me- 
lhor representa os dados. No entanto, este método não é 
recomendado sem pelo menos alguma evidência teórica ou 
empírica do possível tipo de relação considerada. Sem este 
suporte, os resultados podem ter elevada habilidade prediti- 
va, mas pouco uso na tomada de decisões. 


Análise e interpretação da relação separada de utilidade 
parcial. A relação separada de utilidade parcial pode 
parecer uma opção lógica em todos os casos, mas o pes- 
quisador deve perceber que esta flexibilidade na forma da 
relação pode também criar dificuldades na estimação ou 
interpretação. Esses problemas acontecem sempre que o 
pesquisador espera alguma forma de relação monotônica 
entre os níveis (ou seja, alguma forma de preferência or- 
denada presente entre os níveis) sem especificar a forma 
real dessa relação (p.ex., linear ou quadrática). Examine- 
mos um exemplo para percebermos onde podem ocorrer 
tais problemas. 


Considere que temos uma análise conjunta simples tra- 
tando de freguesia de uma loja com dois fatores (tipo de 
loja e distância de percurso à mesma). Podemos estimar 
os conjuntos de utilidades parciais com a relação sepa- 
rada de utilidade parcial. Para o fator de tipo de loja, 
as estimativas de utilidade parcial representam a utili- 
dade relativa de cada tipo de loja sem qualquer ordem 
pré-definida sobre qual deve ser preferida sobre outra 
qualquer. Com distância, a suposição mais provável é 
que distância menor seja preferível sobre a maior. Na 
pior das hipóteses, distâncias mais remotas não devem 
ser preferíveis sobre as menores. 

No entanto, quando empregamos uma relação sepa- 
rada de utilidade parcial, o método das utilidades par- 
ciais não tem o padrão pré-definido da relação linear ou 
quadrática. Podemos descobrir que as utilidades parciais 
estimadas não seguem o padrão prescrito para um ou 
mais níveis, devido mais provavelmente a inconsistên- 
cias nas respostas. Três quilômetros de distância, por 
exemplo, podem ter uma utilidade parcial maior do que 
um quilômetro, o que parece ilógico. 


O pesquisador sempre deve estar ciente da possibili- 
dade dessas violações da relação monotônica (conhecidas 
como inversões) e examinar os resultados para se certifi- 
car da seriedade de quaisquer ocorrências. Retornamos a 
essa questão com mais detalhes quando discutimos esti- 
mação (onde ações corretivas são possíveis) e a interpre- 
tação das utilidades parciais em si. 


Resumo. Ao selecionar a relação de utilidade parcial, 
o pesquisador deve equilibrar habilidade preditiva com 
o uso pretendido do estudo, a fundamentação conceitual 
disponível e o grau de relevância administrativa e de inter- 
pretação necessário. Pode ser necessário estimar diversas 
formas da relação para identificar a mais apropriada para 
o contexto de escolha e o processo de decisão individual. 


Visão geral 
O processo de especificação da forma do modelo envol- 
ve questões relativas à natureza e ao caráter dos fatores 
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e níveis, bem como o processo de decisão utilizado pelo 
respondente. Assim, o pesquisador deve estar ciente das 
suposições inerentes à cada escolha feita quando decidir 
sobre a regra de composição e o tipo de relação de utilida- 
de parcial para cada fator. 


Coleta de dados 


Após ter especificado os fatores e níveis, mais a forma do 
modelo básico, o pesquisador deve tomar três decisões en- 
volvendo coleta de dados: o tipo de método de apresen- 
tação dos estímulos (troca, perfil completo ou compara- 
ção aos pares), o tipo de variável de resposta e o método 
de coleta de dados. O objetivo prioritário é transmitir ao 
respondente as combinações de atributos (estímulos) da 
maneira mais realista e eficiente possível. Na maioria das 
vezes, os estímulos são apresentados em descrições escri- 
tas, apesar de modelos físicos ou pictóricos poderem ser 
muito úteis para atributos estéticos ou sensoriais. 


Escolha de um método de apresentação 

Três métodos de apresentação de estímulos são mais co- 
mumente associados com análise conjunta. Apesar de 
diferirem consideravelmente na forma e na quantia de 
informações apresentadas ao respondente (ver Figura 
7-3), eles são todos aceitáveis dentro do modelo conjunto 
tradicional. A escolha entre métodos de apresentação se 
concentra nas suposições sobre a extensão do processo do 
cliente que é executado durante a tarefa conjunta e o tipo 
de processo de estimação empregado. 


O método de apresentação de trocas. O método de troca 
compara atributos aos pares, ordenando todas as combina- 
ções de níveis (ver Figura 7-3a). Ele tem as vantagens de 
ser simples para o respondente e fácil de administrar, e evi- 
ta que informações se sobreponham, apresentando apenas 
dois atributos por vez. Foi a forma de apresentação mais 
amplamente usada nos anos iniciais da análise conjunta. 
No entanto, o uso desse método diminuiu dramaticamente 
nos últimos anos devido a diversas limitações: 


e Um sacrifício em realismo, ao usar somente dois fatores por 
vez 

e O grande número de julgamentos necessários mesmo para 
um pequeno número de níveis 

e Uma tendência de os respondentes ficarem confusos ou se- 
guirem um padrão de resposta rotineiro por fadiga 

e Falta de habilidade de empregar estímulos pictóricos ou ou- 
tros estímulos não-escritos 

e O uso de somente respostas não-métricas 

e Sua falta de capacidade de usar delineamentos de estímulos 
fatoriais fracionários para reduzir o número de comparações 
feitas. 


Estudos indicam que a terceira abordagem, compara- 
ções aos pares, suplantou os métodos de troca como o se- 
gundo método de apresentação mais usado nas aplicações 
comerciais [118]. 


REGRAS PRÁTICAS 7-3 


Especificação da forma de modelo e 
das relações de utilidade parcial 


e Pesquisadores podem escolher entre duas formas básicas 
de modelo sobre a regra de composição assumida para 
indivíduos: 

e Modelo aditivo: Considera o tipo mais simples de 
regra de composição (utilidade para cada atributo é 
simplesmente adicionada até atingir utilidade geral) 
e requer a tarefa de escolha e os procedimentos de 
estimação mais simples 
Modelo interativo: Adiciona termos de interação 
entre atributos para retratar de maneira mais realista 
a regra de composição, mas exige uma tarefa de 
escolha mais complexa para o respondente e para o 
procedimento de estimação. 

Modelos aditivos geralmente bastam para a maioria 
das situações e são os mais amplamente usados 

e A estimação da utilidade de cada nível (conhecida como 
utilidade parcial) pode seguir uma de três relações: 

e Linear: Demanda que utilidades parciais sejam 
linearmente relacionadas, mas pode ser não-realista 
esperar por tipos específicos de atributos 
Quadrática: Mais adequada quando se espera um 
"ponto ideal" nos níveis do atributo 
Separada: Faz a estimação de cada utilidade parcial 
independentemente de outros níveis, mas tem mais 
chances de encontrar inversões (violações da relação 
teorizada) 


O método de apresentação de perfil completo. O méto- 
do de apresentação mais popular é o de perfil completo, 
principalmente por causa de seu evidente realismo e de 
sua habilidade em reduzir o número de comparações por 
meio do uso de delincamentos fatoriais fracionários. Nes- 
sa abordagem, cada estímulo é descrito separadamente, 
em geral em um cartão de perfil (ver Figura 7-3b). Essa 
técnica demanda menos julgamentos, mas eles são mais 
complexos e podem ser ordenados ou avaliados. Entre 
suas vantagens, estão: 


e Uma descrição mais realista conseguida com a definição de 
um estímulo em termos de um nível para cada fator 

e Uma descrição mais explícita das trocas entre todos os fato- 
res e as correlações ambientais existentes entre os atributos 

e O possível uso de mais tipos de julgamentos de preferência, 
como intenções de compra, probabilidade de experimentar 
e chances de troca — todos difíceis de responder com um mé- 
todo de troca. 


O método de perfil completo não é infalível e enfrenta 
duas grandes limitações com base na habilidade e capaci- 
dade do respondente para tomar decisões razoáveis: 


e Quando o número de fatores aumenta, o mesmo ocorre com 
a possibilidade de sobrecarga de informação. O responden- 
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ANÁLISE CONJUNTA 


(a) Método de troca 


Nível 1 
$1,19 


Fator 1: Preço 


Nível 2 
$1,39 


Nível 4 
$1,69 


Nível 3 
$1,49 


Nível 1: 
Genérico 


Nível 2: 
KX-19 


Nível 3: 
Limpa-tudo 


Nível 4: 
Limpeza total 


Fator 2: Nome da marca 


(b) Método do perfil completo 


(c) Comparação aos pares 


Nome da marca: KX-19 
Preço: $1,19 
Forma: Pó 


Nome da marca: KX-19 
Preço: $1,19 

Forma: Pó 

Realça cores: Sim 


Nome da marca: Genérico 
Preço: $1,49 
Forma: Líquido 


VERSUS 


FIGURA 7-3 Exemplos dos métodos de troca e de perfil completo para apresentação de estímulos. 


te sente-se tentado a simplificar o processo, concentrando- 
se em apenas poucos fatores, quando em uma situação real 
todos os fatores deveriam ser considerados. 

e A ordem na qual os fatores são listados no cartão de estí- 
mulos pode ter um impacto sobre a avaliação. Logo, o pes- 
quisador precisa revezar os fatores entre os respondentes, 
quando possível, para minimizar efeitos de ordem. 


O método de perfil completo é recomendado quando 
o número de fatores é 6 ou menos. Quando o número de 
fatores varia de 7 a 10, o método de troca se torna uma 
possível opção para o método de perfil completo. Se o 
número de fatores excede 10, então métodos alternativos 
(análise conjunta adaptativa) são sugeridos [29]. 


O método de apresentação de combinação aos pares. O 
terceiro método de apresentação, a combinação aos pa- 
res, combina os dois outros métodos. A combinação 
aos pares é uma comparação de dois perfis (ver Figura 
7-3c) em que o respondente geralmente usa uma escala 
de avaliação para indicar o nível de preferência por um 
perfil ao invés do outro [46]. A característica notável da 


comparação aos pares é que o perfil normalmente não 
contém todos os atributos, como no caso do método de 
perfil completo, mas, ao invés disso, apenas uns poucos 
atributos por vez são selecionados na construção de per- 
fis a fim de simplificar a tarefa se o número de atributos é 
grande. O pesquisador deve ser cuidadoso em não levar 
esta característica ao extremo e retratar estímulos com 
pouquíssimos atributos para representar realisticamente 
os objetos. 

É semelhante ao método de troca, no sentido de que 
os pares são avaliados, mas no caso do método de troca 
os pares avaliados são atributos, ao passo que no método 
de comparação aos pares estes são perfis com múltiplos 
atributos. O método de comparação aos pares também 
é instrumental em muitos delineamentos conjuntos es- 
pecializados, como a análise conjunta adaptativa (ACA) 
[87], que é usada em conjunção com um grande número 
de atributos (uma discussão mais detalhada sobre grandes 
quantias de atributos aparece posteriormente neste capí- 
tulo). 


382 Análise Multivariada de Dados 


Criação dos estímulos 

Logo que os fatores e níveis tenham sido selecionados e 
o método de apresentação tenha sido escolhido, o pes- 
quisador se volta para a tarefa de criar os tratamentos 
ou estímulos para avaliação por parte dos respondentes. 
Para qualquer método de apresentação, o pesquisador 
sempre está diante de uma responsabilidade crescente do 
respondente conforme o número de estímulos aumenta 
para lidar com mais fatores ou níveis. O pesquisador deve 
ponderar os benefícios de esforço crescente versus a in- 
formação adicional ganha. As seções a seguir detalham 
as questões envolvidas na criação de estímulos para cada 
método de apresentação. 


O método de apresentação de troca. No caso do método 
de troca, todas as combinações possíveis de atributos são 
usadas. O número de matrizes no método de troca é estri- 
tamente baseado no número de fatores e pode ser calcu- 
lado como: 


N(N-1) 
h) 


Número de matrizes de troca = 


onde N é o número de fatores. Além disso, o pesquisa- 
dor deve lembrar que o número de respostas dentro de 
cada matriz de troca é igual ao produto dos níveis dos 
fatores. 


Por exemplo, cinco fatores resultariam em 10 matrizes 
de troca [(5 x 4)/2 = 10]. Se a matriz de troca tivesse fa- 
tores de três níveis cada, tal matriz incluiria nove (3 x 3) 
avaliações. Se os cinco fatores de nosso exemplo tives- 
sem três níveis cada, então o respondente avaliaria 10 
matrizes de troca, cada uma com 9 avaliações, para um 
total de 90 avaliações. 


Como podemos ver, esse método de apresentação 
pode rapidamente conduzir a responsabilidades pesadas 
sobre o respondente conforme o número de atributos ou 
níveis aumenta. Contudo, esse método mantém a tarefa 
simples, pedindo ao respondente para avaliar somente 
dois fatores por vez, enquanto os outros métodos de apre- 
sentação podem ficar complicados em termos de comple- 
xidade de estímulos. 


Métodos de apresentação de perfil completo ou de com- 
paração aos pares. Os dois métodos restantes — perfil 
completo e comparação aos pares — envolvem a avalia- 
ção de um estímulo por vez (perfil completo) ou pares 
de estímulos (comparação aos pares). Em uma análise 
conjunta simples com um pequeno número de fatores e 
níveis (como aqueles discutidos anteriormente, para os 
quais três fatores com dois níveis cada resultaram em 
oito combinações), o respondente avalia todos os estí- 
mulos possíveis. Isso é conhecido como planejamento 
fatorial. 


À medida que o número de fatores e níveis aumenta, 
esse delineamento se torna impraticável, de uma manei- 
ra semelhante à mostrada no método de troca. Examine- 
mos algumas situações típicas de pesquisa para vermos 
como a tarefa conjunta pode rapidamente se tornar im- 
praticável. 


Se o pesquisador está interessado em avaliar o impacto 
de quatro variáveis com quatro níveis para cada, 256 es- 
tímulos (4 níveis x 4 níveis x 4 níveis x 4 níveis) seriam 
criados em um delineamento fatorial completo para o 
método de perfil completo. Mesmo que o número de 
níveis diminua, uma quantia moderada de fatores pode 
criar uma tarefa difícil. Para uma situação com seis fa- 
tores e dois níveis cada, 64 estímulos seriam necessá- 
rios. Se o número de níveis crescer para somente três 
nos seis fatores, então a quantia de estímulos subiria 
para 729. 


Tais situações obviamente incluem muitos estímulos 
para um respondente avaliar e ainda fornecer respostas 
consistentes e com significado. Um número ainda maior 
de pares de estímulos seria criado para as combinações de 
pares de perfis com diferentes números de atributos. 

Porém, apesar de o respondente possivelmente não ser 
capaz de avaliar todos os potenciais estímulos, a quantia 
destes deve ser grande o bastante para que se derivem 
estimativas estáveis de utilidades parciais. A quantia mí- 
nima de estímulos se iguala ao número de parâmetros a 
serem estimados, calculado como: 


Número de parâmetros estimados = Número total de 
níveis — Número de atributos + 1 


É sugerido que o respondente avalie um conjunto de 
estímulos igual a um múltiplo (duas ou três vezes) do nú- 
mero de parâmetros. No entanto, quando a quantia de ní- 
veis e atributos sobe, o pesquisador deve estar ciente do 
peso colocado sobre o respondente por quantia tão grande 
de tarefas. Pesquisas têm mostrado que respondentes po- 
dem completar até 30 tarefas de escolha, mas depois deste 
ponto a qualidade dos dados pode se tornar questionável 
[92]. O pesquisador então enfrenta um dilema: aumentar 
a complexidade das tarefas de escolha pelo acréscimo de 
mais níveis e/ou fatores faz crescer a quantia de parâmetros 
estimados e o número recomendado de tarefas de escolha. 
O pesquisador deve ponderar o ganho de realismo contra o 
limite sobre o número de tarefas de escolha que podem ser 
completadas por um respondente, o que varia de acordo 
com o tipo de método de apresentação e a complexidade 
dos estímulos. 

Com o número de tarefas de escolhas especificado, o 
que se faz necessário a seguir é um método para desenvol- 
ver um subconjunto dos estímulos totais que ainda forne- 
cem a informação necessária para se fazer estimativas pre- 
cisas e confiáveis de utilidades parciais. A seção a seguir 
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descreve duas abordagens para criação de um conjunto de 
estímulos que atendem tais exigências. 


Definição de subconjuntos de estímulos. O proces- 
so de seleção de um subconjunto de todos os estímulos 
possíveis deve ser feito de maneira a preservar a ortogo- 
nalidade (nenhuma correlação entre níveis de um atribu- 
to) e o aspecto de planejamento balanceado (cada nível 
em um fator aparece o mesmo número de vezes). Discu- 
timos duas abordagens para selecionar o subconjunto de 
estímulos que atendem esses critérios. 


1. Um planejamento fatorial fracionário é o método mais co- 
mum para definir um subconjunto de estímulos para ava- 
liação. Ele seleciona uma amostra de estímulos possíveis, 
em que o número de estímulos depende do tipo de regra de 
composição considerada para ser usada por respondentes. 
Utilizando o modelo aditivo, o qual assume apenas efeitos 
principais sem interações, o método de perfil completo com 
quatro fatores a quatro níveis exige apenas 16 estímulos 
para estimar os efeitos principais. A Tabela 7-6 mostra dois 
conjuntos possíveis de 16 estímulos. Os 16 estímulos devem 
ser cuidadosamente construídos para garantir a estimação 
correta dos efeitos principais. Os dois delineamentos na 
Tabela 7-6 são delineamentos ótimos; eles são ortogonais e 
balanceados. 

Os demais 240 estímulos possíveis em nosso exemplo 
que não estão no planejamento fatorial fracionário esco- 
lhido são usados para estimar termos de interação se for 
desejado. Se o pesquisador decide que interações selecio- 
nadas são importantes e devem ser incluídas na estimação 
do modelo, o planejamento fatorial fracionário deve incluir 
estímulos extras para acomodar as interações. Orientações 
publicadas para planejamentos fatoriais fracionários ou 


componentes de programas conjuntos delinearão os sub- 
conjuntos de estímulos para manter ortogonalidade, tor- 
nando a geração de estímulos de perfil completo bastante 
fácil [1, 17,33, 65]. 

2. Se o número de fatores se tornar muito grande e a metodo- 
logia adaptativa não for aceitável, um planejamento de liga- 
ção pode ser empregado [8]. Nesse delineamento, os fatores 
são divididos em subconjuntos de tamanho apropriado, com 
alguns atributos se sobrepondo entre os conjuntos, de for- 
ma que cada conjunto tenha (um) fator(es) em comum com 
outros conjuntos de fatores. Os estímulos são então constru- 
ídos para cada subconjunto de forma que os respondentes 
jamais percebam a quantia original de fatores em um único 
perfil. Quando as utilidades parciais são estimadas, os con- 
juntos separados de perfis são combinados e um único con- 
junto de estimativas é fornecido. Programas de computador 
lidam com a divisão dos atributos, criação de estímulos e 
sua recombinação para estimação [12]. Quando usamos 
comparações aos pares, o número pode ser muito grande e 
complexo, de modo que os programas interativos geralmen- 
te são usados para selecionar os conjuntos ótimos de pares à 
medida que o questionamento prossegue. 


Estímulos inaceitáveis. A criação de um delinea- 
mento ótimo, com ortogonalidade e equilíbrio, não sig- 
nífica, porém, que todos os estímulos no mesmo serão 
aceitáveis para avaliação. Diversas razões explicam a 
ocorrência de estímulos inaceitáveis. 


1. A primeira é a criação de estímulos “óbvios” — aqueles cuja 
avaliação é óbvia por causa de sua combinação de níveis. Os 
exemplos mais comuns são estímulos com todos os níveis 
com os valores mais altos ou mais baixos. Nesses casos, os 
estímulos realmente fornecem pouca informação sobre es- 


TABELA 7-6 Dois planejamentos fatoriais fracionários alternativos para um modelo aditivo (apenas efeitos principais) com quatro fatores a 


quatro níveis cada 


Planejamento 1: Níveis para... 


Planejamento 2: Níveis para... º 


Estímulo Fator 1 Fator 2 Fator 3 Fator 4 Fator 1 Fator 2 Fator 3 Fator 4 
1 3 2 3 1 2 3 1 4 
2 3 1 2 4 4 1 2 4 
3 2 2 1 2 3 3 2 1 
4 4 2 2 3 2 2 4 1 
5 1 1 | 1 1 1 1 1 
6 4 3 4 1 1 4 4 4 
7 1 3 2 2 4 2 1 3 
8 2 1 4 3 2 4 2 3 
9 2 4 2 | 3 2 3 4 

10 3 3 1 3 3 4 1 2 
11 1 4 3 3 4 3 4 2 
12 3 4 4 2 1 3 3 3 
13 1 2 4 4 2 1 3 2 
14 2 3 3 4 3 1 4 3 
15 4 4 1 4 1 2 2 2 
16 4 1 3 2 4 4 3 1 


Os números nas colunas sob os fatores 1 a 4 são os níveis para cada fator. Por exemplo, o primeiro estímulo no planejamento 1 consiste de nível 3 para o fator 1, 


nível 2 para o fator 2, nível 3 para o fator 3, e nível 1 para o fator 4. 
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colha e podem criar uma percepção de descrença por parte 
do respondente. 

2. A segunda ocorrência é a criação de estímulos inacreditá- 
veis devido à correlação interatributos, a qual pode criar 
estímulos com combinações de níveis (alto índice de quilô- 
metros po litro, alta aceleração) que não são realistas. 

3. Finalmente, restrições podem ser impostas às combinações 
de atributos. O projeto de pesquisa pode excluir certas com- 
binações por serem inaceitáveis (ou seja, certos atributos 
não podem ser combinados) ou inadequadas (p.ex., certos 
níveis não podem ser combinados). Em qualquer desses ca- 
sos, os atributos e níveis são importantes para a questão de 
pesquisa, mas certas combinações devem ser excluídas. 


Em qualquer desses casos, os estímulos inaceitáveis 
apresentam escolhas não-realistas para o respondente e 
devem ser eliminados para garantir um processo válido 
de estimação, bem como uma percepção de credibilidade 
da tarefa de escolha entre os respondentes. Há diversas 
ações que ajudam a eliminar os estímulos inaceitáveis: 


1. Primeiro, o pesquisador pode gerar outro delineamento fa- 
torial fracionário e avaliar a aceitabilidade de seus estímu- 
los. Como muitos planejamentos fatoriais fracionários são 
possíveis a partir de qualquer conjunto maior de estímulos, 
pode ser possível identificar um que não contenha qualquer 
estímulo inaceitável. 

2. Se todos os delineamentos contêm estímulos inaceitáveis 
e um delineamento alternativo melhor não pode ser obti- 
do, então o estímulo inaceitável pode ser eliminado. Ape- 
sar de o delineamento não ser totalmente ortogonal (ou 
seja, será de algum modo correlacionado e é dito quase 
ortogonal), ele não violará quaisquer suposições da aná- 
lise conjunta. Ele criará problemas semelhantes à mul- 
ticolinearidade em regressão (ou seja, instabilidade das 
estimativas quando os níveis são ligeiramente mudados e 
uma diminuição na habilidade em avaliar o impacto único 
de cada atributo). 

3. Muitos programas conjuntos têm uma opção para excluir 
certas combinações de níveis (conhecidas como pares proi- 
bidos). Em tais casos, o programa tenta criar um conjunto 
de estímulos que é tão próximo quanto possível de um óti- 
mo, mas deve ser observado que esta opção não pode supe- 
rar falhas de planejamento na especificação de fatores ou 
níveis. Em casos nos quais existe um problema sistemático, 
o pesquisador não deve se acomodar com um programa que 
pode gerar um conjunto de estímulos, pois o planejamento 
fatorial fracionário resultante ainda pode ter sérios vieses 
(baixa ortogonalidade ou equilíbrio) que podem causar im- 
pacto na estimação de utilidades parciais. 


Todos os delineamentos quase ortogonais devem ser 
avaliados quanto à eficiência de planejamento, que é uma 
medida da correspondência do delineamento em termos 
de ortogonalidade e equilíbrio em relação a um delinea- 
mento ótimo [55]. Normalmente medidos em uma escala 
de 100 pontos (delineamentos ótimos = 100), os delinea- 
mentos não-ortogonais alternativos podem ser avaliados, 
e o mais eficiente com todos os estímulos aceitáveis pode 
ser selecionado. A maioria dos programas de análise con- 


junta para desenvolver delineamentos quase ortogonais 
avalia a eficiência dos delineamentos [54]. 

Estímulos inaceitáveis decorrentes de correlações in- 
teratributos podem ocorrer em delineamentos ótimos ou 
ortogonais, e o pesquisador deve acomodar os mesmos 
durante o desenvolvimento dos delineamentos em uma 
base conceitual. Em termos práticos, as correlações inte- 
ratributos devem ser minimizadas, mas não precisam ser 
nulas se pequenas correlações (0,20 ou menos) acrescen- 
tarem realismo. A maioria dos problemas ocorre no caso 
de correlações negativas, como no caso de quilômetros 
por litro e potência. Acrescentar fatores não-correlacio- 
nados pode reduzir a correlação média interatributos, de 
forma que, com um número realista de fatores (p.ex., 6), a 
correlação média seria próxima de 0,20, o que tem efeitos 
sem maiores consegiiências. O pesquisador sempre deve 
avaliar a credibilidade dos estímulos como uma medida 
de relevância prática. 


Seleção de uma medida de preferência do cliente 

O pesquisador também deve selecionar a medida de 
preferência: ordenação versus avaliação (p.ex., uma es- 
cala de 1 a 10). Apesar de o método de troca empregar 
apenas dados de ordenação, os métodos de comparação 
aos pares e perfil completo podem avaliar a preferência 
obtendo uma avaliação de preferência de um estímulo 
sobre o outro ou apenas uma medida binária de qual é 
preferido. 


Uso de uma medida de preferência por ordenação. 
Cada medida de preferência tem certas vantagens e limi- 
tações. Obter uma medida de preferência por ordenação 
(ou seja, ordenar os estímulos dos mais preferidos até os 
menos preferidos) tem duas grandes vantagens: (1) é pos- 
sivelmente mais confiável, pois a ordenação é mais fácil 
do que avaliação com um número razoavelmente peque- 
no (20 ou menos) de estímulos, e (2) ela fornece maior 
flexibilidade para estimar diferentes tipos de regras de 
composição. 

No entanto, há uma desvantagem importante: é difí- 
cil de administrar, pois o processo de ordenação é mais 
comumente executado pela ordenação de cartões de es- 
tímulos na ordem de preferência, e essa ordenação pode 
ser feita apenas com entrevistas pessoais. 


Medida de preferência por avaliação. A alternativa é 
obter uma avaliação de preferência em uma escala métri- 
ca. Medidas métricas são facilmente analisadas e adminis- 
tradas, mesmo por correio, e permitem que a estimação 
conjunta seja realizada por regressão multivariada. No 
entanto, os respondentes podem ser menos discriminan- 
tes em seus julgamentos do que quando estes são orde- 
nados. Além disso, dado o grande número de estímulos 
avaliados, é útil expandir a quantia de categorias de res- 
posta em relação ao que se vê na maioria das pesquisas 
com clientes. Uma regra prática é ter 11 categorias (ou 
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seja, avaliar de O a 10 ou de O a 100 com incrementos de 
10) para 16 ou menos estímulos, e expandir para 21 cate- 
gorias para mais de 16 estímulos [58]. 


Escolha da medida de preferência. A decisão sobre o tipo 
de medida de preferência a ser usada deve se basear em 
questões práticas e conceituais. Muitos pesquisadores pre- 
ferem a medida por ordenação pelo fato de ela representar 
o processo de escolha inerente em análise conjunta: esco- 
lha entre objetos. De um ponto de vista prático, porém, o 
esforço de se ordenarem grandes quantias de estímulos se 
torna exagerado, particularmente quando a coleta de da- 
dos é feita em um cenário diferente de entrevista pessoal. 

A medida de avaliação tem a vantagem inerente de 
ser fácil de administrar em qualquer contexto de coleta 
de dados, apesar de também ter suas desvantagens. Se os 
respondentes não estão engajados e envolvidos na tarefa 
de escolha, a medida de avaliação pode fornecer pouca 
diferenciação entre perfis (p.ex., todos os perfis avaliados 
mais ou menos igual). Além disso, à medida que a tarefa 
de escolha se torna mais envolvida com estímulos adiício- 
nais, o pesquisador deve se preocupar não somente com a 
fadiga com a tarefa, mas com a confiabilidade das avalia- 
ções ao longo dos estímulos. 


Administração de pesquisa 

No passado, a complexidade da tarefa de análise conjunta 
levava ao uso de entrevistas pessoais para obter as res- 
postas conjuntas. As entrevistas pessoais permitem ao en- 
trevistador explicar as tarefas eventualmente mais difíceis 
associadas à análise conjunta. Desenvolvimentos recen- 
tes em métodos de entrevista, porém, têm possibilitado 
a condução da análise conjunta por correio (com questio- 
nários de lápis e papel ou consultas por computador) e 
por telefone. Se a pesquisa é delineada para garantir que 
o respondente possa assimilar e processar os estímulos 
adequadamente, então todos os métodos de entrevista 
produzem precisão preditiva relativamente parecida [2]. 
O uso de entrevistas por computador tem simplificado 
muito as demandas da tarefa conjunta sobre o responden- 
te e tornado viável a administração de planejamentos de 
perfil completo [79, 113] ao mesmo tempo que tem tam- 
bém acomodado até mesmo a análise conjunta adaptativa 
[87]. Pesquisas recentes demonstraram a confiabilidade e 
a validade da análise conjunta de perfil completo quando 
administrada pela internet [80]. 

Uma preocupação em qualquer estudo conjunto é a 
carga colocada sobre o respondente devido ao número de 
estímulos conjuntos avaliados. Obviamente, o respondente 
poderia não avaliar todos os 256 estímulos de nosso deli- 
neamento fatorial anterior, mas qual é o número adequado 
de tarefas em uma análise conjunta? Uma pesquisa recen- 
te de estudos conjuntos comerciais descobriu que os res- 
pondentes podem facilmente completar até 20 ou mesmo 
30 avaliações conjuntas [51, 92]. Acima disso, as respostas 
começam a ficar menos confiáveis e menos representativas 


da estrutura de referência inerente. O pesquisador sempre 
deve procurar usar o menor número possível, mantendo e- 
ficiência no processo de estimação. Não obstante, ao tentar 
reduzir o esforço envolvido na tarefa de escolha, o pesqui- 
sador não deve torná-la simplista demais ou não-realista. 
Além disso, não há substituto para o pré-teste de um estu- 
do conjunto para avaliar a carga do respondente, o método 
de administração e a aceitabilidade dos estímulos. 


Resumo 

A decisão envolvendo coleta de dados deve ser feita para 
fornecer a tarefa de escolha mais realista e envolvente 
possível. O pesquisador deve considerar a experiência 
total apresentada ao respondente e buscar desenvolver 
uma tarefa de escolha mais ajustada ao plano de pesqui- 
sa. Pesquisadores são encorajados a pré-testar diferentes 
combinações de métodos de apresentação, abordagens de 
coleta de dados e medidas de preferência, para identificar 
o melhor método para cada contexto específico de pes- 
quisa. O desafio é realizar uma tarefa de escolha realista e 
envolvente para o respondente. O impacto de se manter o 
envolvimento do respondente foi avaliado em um estudo 
de tempos de resposta (o tempo necessário para comple- 
tar a tarefa conjunta). Foi demonstrado que tempos de 
resposta mais longos eram associados com resultados con- 
ceitualmente consistentes [34]. O estudo também sugere 
que respondentes com tempos de resposta excessivamen- 
te curtos comumente usavam regras de escolha heurísti- 
cas (p.ex., estratégias simplificadoras) que não refletiam 
o processo de escolha antecipado. Tal estudo destaca a 
necessidade crítica de que pesquisadores sejam cientes 
da experiência total sob a ótica do respondente. O uso de 
análise conjunta não garante resultados mais válidos se a 


REGRAS PRÁTICAS 7-4 


Coleta de dados 


e Coleta de dados por métodos tradicionais de análise 
conjunta: 

e Geralmente se consegue com alguma forma de 
método de perfil completo usando um estímulo 
definido sobre todos os atributos 
O aumento do número de fatores e/ou níveis acima 
da tarefa mais simples (dois ou três fatores com 
apenas dois ou três níveis cada) requer alguma forma 
de planejamento fatorial fracionário que especifique 
um conjunto estatisticamente válido de estímulos 

Metodologias alternativas (adaptativas ou baseadas 

em escolha) discutidas em seções anteriores fornecem 

opções em termos da complexidade e realismo da tarefa 

de escolha que pode ser acomodada 

Respondentes devem se limitar a avaliar não mais do 

que 30 estímulos, independentemente da metodologia 

utilizada 
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compararmos com outras técnicas multivariadas. Ao in- 
vés disso, o pesquisador deve procurar criar uma tarefa 
de escolha que não seja focada sobre as necessidades ana- 
líticas, mas sobre os respondentes, para verdadeiramente 
representar sua estrutura de preferência. 


ESTÁGIO 3: SUPOSIÇÕES DA 
ANÁLISE CONJUNTA 


A análise conjunta tem o menor conjunto restritivo de 
suposições associadas com a estimação do modelo. O de- 
lineamento experimental estruturado e a natureza gene- 
ralizada do modelo tornam desnecessários a maioria dos 
testes realizados em outros métodos de dependência. Por- 
tanto, os testes estatísticos de normalidade, homocedasti- 
cidade e independência que foram executados para outras 
técnicas de dependência não são necessários para a aná- 
lise conjunta. O emprego de delineamentos de estímulos 
baseados em estatísticas também garante que a estimação 
não seja confusa e que os resultados sejam interpretáveis 
sob a regra de composição assumida. 

Ainda assim, mesmo com menos suposições estatísti- 
cas, as suposições conceituais talvez sejam maiores do que 
em qualquer outra técnica multivariada. Como já men- 
cionado, o pesquisador deve especificar a forma geral do 
modelo (efeitos principais versus modelo interativo) antes 
que a pesquisa seja delineada. O desenvolvimento da ta- 
refa conjunta real sustenta essa decisão e torna impossível 
testar modelos alternativos logo que a pesquisa é deline- 
ada e os dados são coletados. A análise conjunta não é 
como a regressão, por exemplo, na qual os efeitos adicio- 
nais (termos de interação ou não-lineares) podem ser fa- 
cilmente avaliados depois que os dados foram coletados. 
Em análise conjunta, o pesquisador deve decidir quanto à 
forma do modelo e delinear a pesquisa em conformidade 
com isso. Logo, a análise conjunta, embora tenha poucas 
suposições estatísticas, é bem orientada teoricamente em 
seu delineamento, estimação e interpretação. 


ESTÁGIO 4: ESTIMAÇÃO 
DO MODELO CONJUNTO E 
AVALIAÇÃO DO AJUSTE GERAL 


As opções disponíveis ao pesquisador em termos de téc- 
nicas de estimação aumentaram dramaticamente nos últi- 
mos anos. Além disso, o desenvolvimento de técnicas em 
conjunção com métodos especializados de apresentação 
de estímulos (por exemplo, a análise conjunta adaptativa 
ou a baseada em escolhas) é apenas um melhoramento 
desse tipo. O pesquisador, ao obter os resultados de um 
estudo de análise conjunta, tem inúmeras opções disponí- 
veis quando seleciona o método de estimação e avalia os 
resultados (ver Figura 7-4). 


Seleção de uma técnica de estimação 


Por muitos anos, o tipo de processo de estimação foi ditado 
pela escolha de medida de preferência. No entanto, pes- 
quisas recentes se concentram no desenvolvimento de uma 
abordagem alternativa de estimação apropriada para todos 
os tipos de medidas de preferência, ao mesmo tempo que 
também fornece uma metodologia de estimação mais ro- 
busta e melhoras em resultados agregados e desagregados. 


Abordagens tradicionais de estimação 
Medidas de preferência por ordem de classificação foram 
tipicamente estimadas usando uma forma modificada de 
análise de variância especificamente planejada para dados 
ordinais. Entre os programas de computador mais popu- 
lares e conhecidos estão o MONANOVA (Análise Mo- 
notônica de Variância) [46, 53] e o LINMAP [95]. Esses 
programas fornecem estimativas de utilidades parciais de 
atributos, de modo que a ordem de classificação de sua 
soma (utilidade total) para cada tratamento está correla- 
cionada tanto quanto possível com a ordem observada. 
Quando uma medida métrica de preferência é usada 
(p.ex., avaliações, em vez de ordenações), então muitos 
métodos, até mesmo a regressão múltipla, podem estimar 
as utilidades parciais para cada nível. A maioria dos pro- 
gramas disponíveis hoje em dia pode acomodar qualquer 
tipo de classificação (avaliações ou ordenamentos), bem 
como estimar qualquer um dos três tipos de relações (li- 
near, ponto ideal e utilidade parcial). 


Extensões para o processo básico de estimação 

Até este ponto, discutimos apenas estimação do modelo 
conjunto básico com efeitos principais e talvez de intera- 
ção. Apesar de esta formulação do modelo ser a fundamen- 
tação de todas as análises conjuntas, extensões da mesma 
podem ser garantidas em alguns casos. As seções a seguir 
discutem extensões aplicáveis a métodos desagregados e 
agregados. 

Uma das principais críticas às estimações de modelo 
agregado é a falta de estimativas separadas de utilidades 
parciais para cada indivíduo versus a solução agregada 
única. Porém, o pesquisador nem sempre é capaz de utili- 
zar uma abordagem desagregada devido a considerações 
de planejamento (p.ex., tipo de formato de escolha, núme- 
ro de variáveis ou tamanho amostral). Um método para 
explicar heterogeneidade é a estimação bayesiana discu- 
tida na próxima seção [4, 55]. Uma segunda metodologia 
é a modificação da estimação tradicional para introduzir 
uma forma de heterogeneidade de respondentes, o que 
representa a variação esperada ao longo de indivíduos se 
o modelo foi estimado no nível desagregado [111]. Em 
ambos, foram conseguidas melhorias na precisão prediti- 
va em níveis comparáveis âqueles encontrados em mode- 
los desagregados [76]. 

Outra extensão no modelo conjunto básico é a incor- 
poração de variáveis adicionais no processo de estimação, 
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FIGURA 7-4 Estágios 4-7 do diagrama de decisão da análise conjunta. 


particularmente variáveis refletindo características do in- 
divíduo ou de contexto de escolha. Até aqui assumimos 
que preferências para os estímulos são completamente 
expressadas nos níveis dos vários atributos. Mas e quan- 
to a outras medidas menos quantificáveis, como atitudes 
ou mesmo características sócio-econômicas? Ainda que 
possamos considerar que essas diferenças individuais se- 
rão refletidas nas estimativas desagregadas de utilidades 
parciais, em alguns casos é benéfico estabelecer a relação 
com esses tipos de variáveis. Pesquisas recentes têm ex- 
plorado técnicas para inclusão de variáveis sócio-econô- 


micas e ligadas a contexto de escolha, bem como variáveis 
de atitudes e até mesmo de construtos latentes [142]. Tais 
técnicas não estão amplamente disponíveis ainda, mas 
elas representam abordagens potencialmente úteis para 
quantificar os impactos de variáveis diferentes daquelas 
usadas na construção dos estímulos. 


Estimação bayesiana: uma 

abordagem radicalmente nova 

Os procedimentos de estimação acima descritos se susten- 
tam na teoria estatística clássica que é a fundamentação 
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para todos os métodos multivariados discutidos neste tex- 
to. Esses métodos, porém, estão sendo superados por uma 
nova abordagem, a análise bayesiana [22], que é muito 
diferente em seu método básico de estimação do modelo 
conjunto. A aplicação de análise bayesiana está aconte- 
cendo não somente em análise conjunta [3, 56, 62], mas 
também em métodos mais tradicionais, como a análise de 
regressão [4, 93]. 


Os aspectos básicos da análise bayesiana. A premissa 
inerente da análise bayesiana é o teorema de Bayes, que 
é baseado na definição de dois valores de probabilidade: a 
probabilidade a priori e a probabilidade a posteriori. Em 
um sentido geral, a probabilidade a posteriori é aquela 
que obtemos a partir das observações reais de dados. A 
probabilidade a priori é uma estimativa do quão provavel- 
mente este conjunto particular de observações deve ocor- 
rer na população. Combinando essas duas probabilidades, 
fazemos alguma estimativa da probabilidade real de um 
evento (conhecida como a probabilidade conjunta). 


Examinemos um exemplo simples para ilustrar como 
este método funciona na estimação de probabilidade de 
ocorrência de um evento. Considere que uma firma está 
tentando entender o impacto de seu programa de lealda- 
de em conseguir que indivíduos comprem um programa 
estendido de garantia. A questão é se deve continuar o 
suporte ao programa de lealdade como uma maneira de 
aumentar as compras das extensões. Uma consulta aos 
clientes chegou aos seguintes resultados: 


Probabilidade a posteriori de: 


Comprar uma Não comprar 


Tipo de cliente extensão uma extensão 
Membro de programa 0,40 0,60 
de lealdade 
Não-membro de pro- 0,10 0,90 


grama de lealdade 


Se olharmos apenas para esses resultados, percebe- 
remos que membros do programa de lealdade têm qua- 
tro vezes mais chances de comprar uma extensão do que 
os não-membros. Esta figura representa a probabilidade 
a posteriori (ou seja, a probabilidade de comprar uma 
extensão com base no tipo de cliente) que podemos es- 
timar diretamente a partir dos dados. 

A probabilidade a posteriori é apenas parte da aná- 
lise, pois ainda precisamos conhecer mais uma proba- 
bilidade: a de que clientes se juntem ao programa de 
lealdade. Esta probabilidade a priori descreve a possi- 
bilidade de que um dado cliente se junte ao programa 
de lealdade. 

Se estimamos que 10% de nossos clientes são mem- 
bros do programa de lealdade, podemos agora estimar 
as probabilidades de que qualquer tipo de cliente com- 


pre uma extensão. Fazemos isso multiplicando a proba- 
bilidade a priori pela a posteriori para obter a probabili- 
dade conjunta. Para nosso exemplo, este cálculo resulta 
no que se segue: 


PROBABILIDADES CONJUNTAS DE COMPRA 
DE UMA EXTENSÃO 
Probabilidade conjunta 
Probabilida- Sem 
Tipo de cliente deapriori Compra compra Total 
Membro do 10% 0,04 0,06 0,10 
programa de 
lealdade 
Fora do pro- 90% 0,09 0,81 0,90 
grama de leal- 
dade 
Total 0,13 0,87 1,00 


Agora podemos ver que mesmo que membros do pro- 
grama de lealdade comprem extensões em um ritmo mui- 
to maior do que não-membros, a proporção relativamente 
menor de clientes no programa de lealdade (10%) os tor- 
na uma minoria de compradores da extensão. Na verdade, 
membros do programa de lealdade compram apenas algo 
em torno de 30% (0,04/0,13 = 0,307) das extensões. 


Como vimos neste exemplo, podemos perceber que 
não estamos fazendo uma estimação estatística, mas em- 
pírica. Como tal, a estimação bayesiana se sustenta em 
análise extensiva dos dados para determinar as estimati- 
vas de probabilidade precisas a partir dos dados. 


Vantagens e desvantagens da estimação bayesiana. Ao 
se usar análise bayesiana para a estimação de um modelo 
conjunto, o pesquisador não precisa fazer nada diferente; 
esses valores de probabilidades são estimados pelo pro- 
grama a partir do conjunto de observações. A questão a 
ser colocada, porém, é: quais são as vantagens e desvanta- 
gens de se empregar esta técnica? Examinemos com mais 
detalhes. 


Vantagens. Muitos estudos examinaram a estimação 
bayesiana em comparação com métodos mais tradicionais 
e em todos os casos foi constatado que a estimação baye- 
siana é comparável ou até superior tanto para estimação 
de utilidade parcial quanto na capacidade preditiva [6]. 
No entanto, as vantagens vão além da mera precisão de 
estimação. Dada a natureza das estimativas exigidas de 
probabilidade, a estimação bayesiana permite que os mo- 
delos conjuntos sejam estimados individualmente onde 
antes apenas modelos agregados eram viáveis (ou seja, 
modelos conjuntos baseados em escolha e mesmo mode- 
los mais complexos com termos de interação). Para este 
propósito, ela tem sido incorporada em todos os modelos 
conjuntos básicos [89, 91]. 
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Desvantagens. Estimação bayesiana tem alguns 
problemas. Primeiro, ela requer uma amostra grande 
(tipicamente 200 ou mais respondentes), pois ela é de- 
pendente da amostra para estimativas de probabilidades 
a priori. Esta exigência difere de modelos conjuntos tra- 
dicionais que poderiam ser estimados somente para um 
indivíduo. Segundo, ela exige consideravelmente mais 
recursos computacionais por usar uma abordagem itera- 
tiva na estimação. Análises que podem ser estimadas em 
segundos usando meios tradicionais agora demandam 
várias horas [103]. Mesmo que os rápidos avanços no 
poder computacional de alguma forma minimizem esse 
problema, o pesquisador ainda deve estar ciente dos re- 
cursos extras exigidos. 


Resumo. Como a análise bayesiana está se tornando 
uma alternativa viável para a estimação de outras téc- 
nicas multivariadas, seu emprego em análise conjunta 
também está aumentando. Algumas questões ainda pre- 
cisam ser tratadas, mas a estimação bayesiana represen- 
ta melhoras potencialmente significantes em relação a 
métodos existentes em termos de habilidade preditiva 
e explanatória. Pesquisadores são encorajados a exa- 
minar opções de estimação bayesiana em análise con- 
junta sempre que disponíveis e continuar a seguir seu 
progresso à medida que as questões de implementação 
são abordadas. 


Utilidades parciais estimadas 


Uma vez que um método de estimação é escolhido, as 
respostas a cada estímulo são analisadas para estimar as 
utilidades parciais para cada. O método mais comum é 
alguma forma de regressão, dependendo se a medida de- 
pendente é métrica ou não. Como tais, as utilidades par- 
ciais estimadas são essencialmente coeficientes de regres- 
são estimados com variáveis dicotômicas, e um nível para 
cada atributo é eliminado para evitar singularidade (ver 
Capítulo 4 para uma discussão mais detalhada do uso de 
variáveis dicotômicas em regressão). Assim, as estimati- 
vas resultantes de utilidade parcial devem ser interpreta- 
das em um sentido relativo. 


Aqui está um exemplo de utilidades parciais estimadas 
usando ACA [87] para um planejamento simples de três 
atributos com cinco e quatro níveis. 
Atributo 1 Atributo 2 Atributo 3 
Utilidade Utilidade Utilidade 
Nível parcial Nível parcial Nível parcial 

1 —0,657 1 —0,751 1 —0,779 

2 —0,0257 2 —0,756 2 —(0,826 

3 —0,378 3 0,241 3 —0,027 

+ 0,098 4 0,302 E 0,667 

5 —0,0111 


Como podemos ver, as utilidades parciais devem ser jul- 
gadas umas em relação às outras, pois elas têm valores 
negativos e positivos. Por exemplo, para o segundo atri- 
buto, o segundo nível é na verdade o menos desejado 
(mais negativo) por uma pequena quantia, com o quarto 
nível tendo a maior utilidade. Os níveis também podem 
ser comparados ao longo dos atributos, mas deve-se to- 
mar cuidado para que primeiro se avaliem os níveis den- 
tro do atributo para estabelecer sua posição relativa. 


Para ajudar na interpretação, muitos programas con- 
vertem as estimativas de utilidade parcial para alguma es- 
cala em comum (p.ex., do mínimo de zero até um máximo 
de 100 pontos) para permitir uma comparação nos atribu- 
tos para um indivíduo e ao longo de indivíduos. 


Abaixo estão as utilidades parciais escalonadas para o 
exemplo que acaba de ser discutido. Como podemos ver, 
elas são muito mais fáceis de interpretar, tanto dentro de 
atributos quanto ao longo dos mesmos. 


Atributo 1 Atributo 2 Atributo 3 

Utilidade Utilidade Utilidade 
Nível parcial Nível parcial Nível parcial 
1 0,00 1 0,23 1 2,15 
2 18,29 2 0,00 2 0,00 
3 12,76 3 45,59 3 36,59 
4 34,53 4 48,38 4 68,28 
5 29,54 


A ordenação relativa nos valores originais de utilida- 
de é preservada, mas agora o menor nível em cada atri- 
buto é marcado como zero e todos os demais níveis são 
valorados relativamente a este valor mínimo. 


Como as estimativas de utilidade parcial são sempre 
interpretadas em uma perspectiva relativa (uma utilida- 
de parcial versus outra) no lugar de um valor absoluto (a 
quantia real de mudança na medida dependente), o pes- 
quisador deve se concentrar em um método para retratar 
os resultados que mais facilite a aplicação e a interpreta- 
ção. O escalonamento das estimativas de utilidade parcial 
fornece uma maneira simples, ainda que efetiva, de apre- 
sentação da posição relativa de cada nível. Este formato é 
também útil para representação gráfica e oferece um modo 
de usar mais facilmente as utilidades parciais em outras 
técnicas multivariadas, como a análise de agrupamentos. 


Avaliação da qualidade de ajuste do modelo 


Os resultados da análise conjunta são avaliados quanto a 
precisão em nível individual e agregado. O objetivo em 
ambas as situações é determinar o quão consistentemente 
o modelo prevê o conjunto de avaliações de preferência. 
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Avaliação de modelos conjuntos no nível individual 
O papel da medida de qualidade de ajuste é avaliar a qua- 
lidade do modelo estimado comparando valores reais das 
variáveis dependentes com valores previstos pelo modelo 
estimado. Por exemplo, em regressão múltipla correlacio- 
namos os valores reais e previstos da variável dependente 
por meio do coeficiente de determinação (R”) ao longo de 
todos os respondentes. Em análise discriminante, compa- 
ramos as pertinências reais e previstas a grupos para cada 
membro da amostra na matriz de classificação. O que di- 
ferencia análise conjunta de outras técnicas multivariadas 
é que modelos conjuntos separados são estimados para 
cada indivíduo, exigindo que a medida de qualidade do 
ajuste forneça informação sobre as utilidades parciais esti- 
madas para cada respondente. Como vemos nas próximas 
discussões, este processo requer cuidado especial no tipo 
de medida de qualidade de ajuste usada e como é inter- 
pretada. 


Tipos de medidas de qualidade de ajuste. Para um mo- 
delo de nível individual, a medida de qualidade do ajuste 
é calculada para cada indivíduo. Como tal, ela se baseia na 
quantia e tipos de tarefas de escolha executadas por cada 
respondente. Quando as tarefas de escolha envolvem da- 
dos de ordenação não-métricos, correlações baseadas nas 
ordens reais e previstas (p.ex., rô de Spearman ou tau de 
Kendall) são usadas. Quando as tarefas de escolha envol- 
vem uma avaliação (p.ex., preferência em uma escala de 
O a 100), então uma simples correlação de Pearson, como 
aquela usada em regressão, é adequada. Nos dois casos, as 
utilidades parciais estimadas são empregadas para gerar 
valores previstos de preferência (ordenações ou avalia- 
ções métricas) para cada estímulo. As preferências reais 
e previstas são então correlacionadas para cada pessoa e 
testadas quanto a significância estatística. Indivíduos que 
têm pouco ajuste preditivo devem ser candidatos para eli- 
minação da análise. 


Avaliação da força da medida de qualidade de ajuste. 
Quão altos devem ser os valores de qualidade de ajus- 
te? Como ocorre com a maioria das medidas de ajuste, 
valores maiores indicam um ajuste melhor. No entanto, 
na maioria dos experimentos conjuntos o número de es- 
tímulos não excede substancialmente o número de parâ- 
metros, e o potencial para superajustar os dados, e assim 
superestimar a qualidade de ajuste, está sempre presente. 
Medidas de qualidade de ajuste não são corrigidas quanto 
aos graus de liberdade no modelo de estimação. 

Logo, à medida que o número de estímulos se apro- 
xima da quantia de parâmetros estimados, o pesquisador 
deve aplicar uma referência maior para valores aceitáveis 
de qualidade de ajuste. Por exemplo, regressão múltipla 
é muitas vezes usada no processo de estimação métrica. 
Ao avaliar qualidade de ajuste com o coeficiente de de- 
terminação (R”), o pesquisador sempre deve calcular o Rº 
ajustado, que compensa para menos graus de liberdade. 


Assim, em muitos casos, o que parecem ser valores de 
qualidade de ajuste aceitáveis em análise conjunta podem, 
na realidade, refletir valores ajustados consideravelmente 
menores, pois o número de estímulos avaliado não é subs- 
tancialmente maior do que o número de utilidades par- 
ciais (ver Capítulo 4 para uma discussão mais detalhada 
sobre o processo de ajuste). Além disso, valores que são 
excessivamente elevados (muito próximos de 100%) po- 
dem não refletir ajuste exageradamente bom, mas indicar 
respondentes que podem não estar seguindo corretamen- 
te as tarefas de escolha e assim também são candidatos à 
eliminação. 


Uso de uma amostra de validação. Os pesquisadores 
são também encorajados a medir a precisão do modelo 
não apenas nos estímulos originais, mas também com um 
conjunto de estímulos de validação. Em um procedimento 
semelhante a uma amostra de validação em análise discri- 
minante, o pesquisador prepara mais cartões de estímulos 
do que o necessário para a estimação das utilidades par- 
ciais, e o respondente avalia todos ao mesmo tempo. Pa- 
râmetros do modelo conjunto estimado são então usados 
para prever a preferência para o novo conjunto de estímu- 
los, os quais são comparados com as respostas reais para 
se avaliar a confiabilidade do modelo [48]. A amostra de 
validação também dá ao pesquisador uma oportunidade 
para uma avaliação direta de estímulos de interesse para 
o estudo da pesquisa. 

Porém, ao medir a qualidade de ajuste de uma amos- 
tra de validação, o pesquisador deve ser muito cuidadoso 
na avaliação dos valores reais da medida. Na maioria dos 
casos, a amostra de validação pode conter um pequeno 
número de estímulos adicionais (de quatro a seis), e as- 
sim os valores são calculados para um pequeno número 
de observações. Valores extremamente altos podem ser 
suspeitos no sentido de que eles não refletem bom ajuste, 
mas problemas fundamentais na estrutura de preferência 
estimada do processo de escolha em si. 


Avaliação do nível agregado 

Se uma técnica de estimação agregada é usada, então os 
mesmos procedimentos básicos se aplicam, só que agora 
agregados ao longo de respondentes. Pesquisadores têm 
também a opção de escolherem uma amostra de validação 
de respondentes em cada grupo para avaliarem precisão 
preditiva. Em tais casos, o modelo agregado é aplicado a 
indivíduos e então avaliado em termos de precisão prediti- 
va de suas escolhas. Este método não é adequado para re- 
sultados desagregados, pois nenhum modelo generalizado 
está disponível para ser aplicado na amostra de validação, 
e cada respondente na amostra de estimação apresenta 
estimativas individualizadas de utilidade parcial. 


Resumo 
A natureza única da estimação de modelos de análise con- 
junta requer uma perspectiva diferente sobre medidas de 
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qualidade de ajuste tanto no nível individual quanto agre- 
gado. Como qualquer medida de qualidade de ajuste pode 
ser superajustada quando se avalia um único respondente, 
o pesquisador deve cuidar para complementar qualquer 
processo empírico com avaliação adicional através do 
exame da estrutura estimada de preferência, como discu- 
tido na próxima seção. Esta avaliação é particularmente 
importante para valores extremamente altos, que podem 
na verdade sinalizar mais problemas fundamentais do que 
ajuste excelente propriamente dito. 


ESTÁGIO 5: INTERPRETAÇÃO 
DOS RESULTADOS 


A abordagem corriqueira para interpretar a análise con- 
junta é desagregada. Ou seja, cada respondente é modela- 
do separadamente e os resultados do modelo (estimativas 
de utilidade parcial e avaliações de importância de atribu- 
to) são examinados para cada respondente. Interpretação, 
contudo, também pode ocorrer com resultados agregados. 
Se a estimação do modelo é feita no nível individual e en- 
tão agregada, ou estimativas agregadas são feitas para um 
conjunto de respondentes, a análise ajusta um modelo ao 
agregado das respostas. Como se pode esperar, tal proces- 
so geralmente conduz a resultados pobres quando se prevê 
o que qualquer respondente faria ou quando se interpre- 
tam as utilidades parciais para qualquer respondente em 
particular. A menos que o pesquisador esteja lidando com 
uma população que definitivamente exiba comportamento 
homogêneo em relação aos atributos, a análise agregada 


REGRAS PRÁTICAS 7-5 


Estimação de um Modelo Conjunto 


e A seleção de um método de estimação é direta: 

e O método mais comum é uma abordagem baseada 
em regressão, aplicável com todas as medidas 
métricas de preferência 
O uso de dados ordenados de preferência exige uma 
estimação mais especializada (p.ex., MONANOVA) 
Métodos bayesianos estão surgindo, os quais 
permitem modelos individuais a serem estimados 
onde não era possível antes, mas eles demandam 
amostras maiores, são mais intensivos em termos 
computacionais e não estão tão disponíveis 

e Qualidade de ajuste deve ser avaliada com: 

e Coeficiente de correlação (R”) entre preferências 
reais e previstas 
Medidas baseadas em ordenações das preferências 
previstas e reais 
Medidas para as amostras de estimação e de 
validação de estímulos adicionais não usados no 
processo de estimação 


não deve ser usada como o único método de estudo. Não 
obstante, muitas vezes a análise agregada prevê mais pre- 
cisamente comportamento agregado, como participação 
de mercado. Assim, o pesquisador deve identificar o prin- 
cipal objetivo do estudo e empregar o nível apropriado de 
análise ou uma combinação dos níveis da mesma. 


Exame das utilidades parciais estimadas 


O método mais comum de interpretação é um exame das 
estimativas das utilidades parciais para cada fator, ava- 
liando sua magnitude e padrão. Estimativas de utilidades 
parciais são tipicamente escalonadas de modo que quanto 
maior a utilidade parcial (seja positiva ou negativa), maior 
o impacto sobre a utilidade geral. Como observado ante- 
riormente, muitos programas reescalonam as utilidades 
parciais para uma escala em comum, como uma de O a 100, 
de modo a viabilizar uma comparação mais fácil entre fa- 
tores para um indivíduo e mesmo entre indivíduos. 


Garantia de relevância prática 

Ao avaliar qualquer conjunto de estimativas de utilidades 
parciais, o pesquisador deve considerar tanto a relevância 
prática quanto a correspondência com quaisquer relações 
teóricas entre níveis. Em termos de relevância prática, a 
principal consideração é o grau de diferenciação entre 
utilidades parciais dentro de cada atributo. Por exemplo, 
valores de utilidade parcial podem ser graficamente repre- 
sentados para identificação de padrões. Padrões relativa- 
mente constantes indicam um grau de indiferença entre os 
níveis, no sentido de que o respondente não viu entre os 
níveis muita diferença que afetasse a escolha. Desse modo, 
seja por meios gráficos, seja por comparação empírica en- 
tre os níveis, é imperativo que o pesquisador avalie cada 
conjunto de utilidades parciais para garantir que eles sejam 
uma representação adequada da estrutura de preferência. 


Avaliação de consistência teórica 

Muitas vezes um atributo tem uma estrutura teórica para 
as relações entre níveis. A mais comum é a monotônica, 
tal que as utilidades parciais do nível C devem ser maio- 
res do que aquelas do nível B, que, por sua vez, devem 
ser maiores do que as utilidades parciais do nível A. Si- 
tuações comuns nas quais tal relação é teorizada incluem 
atributos como preço (preços menores sempre têm valores 
maiores), qualidade (qualidade maior é sempre melhor), 
ou conveniência (lojas mais próximas são preferíveis a lo- 
jas mais distantes). Com estes e muitos outros atributos, o 
pesquisador tem uma relação sustentada em teoria à qual 
os valores de utilidade parcial devem corresponder. 

O que acontece quando as utilidades parciais não se- 
guem o padrão teorizado? Introduzimos o conceito de 
uma inversão em nossa discussão anterior de formas de 
modelo para as situações nas quais os valores de utilida- 
de parcial violam a relação monotônica assumida. Em um 
sentido simples, estamos nos referindo às situações apa- 
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rentemente sem sentido nas quais respondentes valorizam 
o pagamento de preços mais altos, tendo menor qualidade 
ou percorrendo distâncias mais longas. Uma inversão re- 
presenta distorções potencialmente sérias na representa- 
ção de uma estrutura de preferência. Isso não apenas afeta 
a relação entre níveis adjacentes, mas pode afetar as utili- 
dades parciais para o atributo inteiro. 

Quando inversões criam uma estrutura de preferência 
que não pode ser teoricamente suportada, o pesquisador 
deve então considerar a eliminação do respondente. Está 
em questão o tamanho e a fregiiência de inversões, pois 
elas representam padrões ilógicos ou inconsistentes na es- 
trutura geral de preferência quando medida pelas utilida- 
des parciais. 


Fatores que contribuem para inversões. Dadas as conse- 
quências potencialmente sérias de uma inversão, um pes- 
quisador deve reconhecer fatores no projeto de pesquisa 
que criam a possibilidade de inversões. Tais fatores devem 
ser considerados quando se julga a extensão de inversões 
e quando se chega a uma conclusão quanto à validade ou 
não de uma estrutura de preferência: 


e Empenho do respondente: Um fator crítico no sucesso de 
qualquer análise conjunta é interesse mantido nas tarefas 
conjuntas a fim de se avaliar com precisão a estrutura de 
preferência. Muitos fatores, porém, podem diminuir este 
empenho, como cansaço do respondente com as tarefas 
conjuntas ou outras partes da pesquisa, ou desinteresse na 
tarefa de pesquisa. Uma medida simples de interesse do res- 
pondente é o tempo despendido nas tarefas conjuntas. O 
pesquisador sempre deve pré-testar as tarefas conjuntas e 
desenvolver um período mínimo de tempo considerado ne- 
cessário para completar a tarefa de forma confiável. Em se- 
guida, para indivíduos abaixo deste tempo referencial, deve 
ser dada consideração especial no exame de suas utilidades 
parciais quanto a inversões. 

e Método de coleta de dados: O método preferido de adminis- 
tração é através de entrevista pessoal por conta da possível 
complexidade das tarefas de escolha, mas avanços recentes 
tornam viáveis meios alternativos de coleta de dados (p.ex., 
via Web, correio ou telefone). Apesar de estudos funda- 
mentarem a validade preditiva dessas medidas alternativas, 
o pesquisador deve considerar que tais situações podem 
exibir um nível maior de inversões devido a fatores como 
crescente empenho exigido do respondente, perda de inte- 
resse, ou mesmo incapacidade de resolver questões ou até 
confusão com a tarefa de pesquisa. 

O pesquisador sempre deve incluir alguma forma de 
interrogatório sobre as manifestações do respondente, 
através de uma série de questões administradas após uma 
tarefa conjunta ou por meio de uma série de sondagens pro- 
movidas pelo entrevistador em uma entrevista pessoal. O 
objetivo deve ser a avaliação do nível de compreensão do 
respondente sobre os fatores e níveis envolvidos, bem como 
do realismo da tarefa de escolha. 

e Contexto de pesquisa: Uma questão final que contribui para 
o nível potencial de inversões é o objeto/conceito sob es- 
tudo. Produtos ou situações de pouco envolvimento (p.ex., 
bens, idéias ou conceitos de baixo risco) sempre correm o 


risco de inconsistências nas escolhas reais e nas utilidades 
parciais resultantes. O pesquisador sempre deve considerar 
a habilidade de qualquer conjunto de tarefas de escolha de 
manter suficiente envolvimento do cliente em um proces- 
so de decisão quando na realidade o cliente pode não dar 
à decisão o nível de idealização modelada pelas tarefas 
conjuntas. Muitas vezes, pesquisadores identificam muitos 
atributos para consideração, complicando em demasia um 
processo simples do ponto de vista do respondente. Quan- 
do esta situação acontece, o respondente pode considerar 
as tarefas de escolha muito complicadas ou não-realistas e 
fornecer resultados inconsistentes ou ilógicos. 


Identificação de inversões. Com as potenciais influências 
do plano de pesquisa consideradas, o pesquisador ainda se 
encontra diante de uma questão crítica: o que é realmente 
uma inversão? Tecnicamente, sempre que uma utilidade 
parcial é assumida como sendo maior do que um nível ad- 
jacente mas não é, ela viola a relação monotônica e pode 
ser considerada uma inversão. No entanto, qual quantia 
de aumento é necessária para evitar ser considerada uma 
inversão? E se os dois níveis adjacentes forem iguais? E se 
o declínio for minúsculo? 

O primeiro passo é identificar possíveis inversões. Um 
método simples mas efetivo é retratar graficamente os pa- 
drões de utilidades parciais para cada atributo. Padrões 
ilógicos podem ser rapidamente identificados dentro de 
cada atributo. Contudo, à medida que o número de atri- 
butos e respondentes aumenta, a necessidade de alguma 
medida empírica se torna evidente. É um simples proces- 
so de calcular as diferenças entre níveis adjacentes, que 
podem ser examinadas depois quanto a padrões ilógicos. 
Um declínio minúsculo pode não constituir uma inversão; 
então, quão grande deve ser a diferença? No entanto, por 
uma questão prática, alguma amplitude de diferenças, 
mesmo quando contrária ao padrão esperado, seria pro- 
vavelmente considerada aceitável. Para estabelecer esse 
grau de aceitabilidade, existem diversas opções: 


e Um método é examinar as diferenças e ver onde ocorre 
uma irregularidade natural, denotando aqueles valores ver- 
dadeiramente diferentes. Novamente, o pesquisador está 
buscando valores verdadeiramente distintos que indiquem 
preferências contrárias à relação presumida. 

e Uma segunda abordagem é tentar e estabelecer alguma es- 
timativa de um intervalo de confiança que leve em conta as 
características estabelecidas de distribuição das diferenças. 
Uma possibilidade é determinar o erro padrão das diferen- 
ças e então usar isso para construir um intervalo de confian- 
ça em torno de zero para denotar diferenças verdadeira- 
mente significativas. Devemos observar que, tecnicamente o 
intervalo de confiança deveria ser construído internamente, 
mas pouquíssimas observações são fornecidas sobre qual- 
quer fator para se fazer isso. Logo, faz-se necessário o uso 
do erro padrão calculado ao longo de sujeitos. 


Em última instância, para responder esta questão, o 
pesquisador é encorajado a examinar a distribuição de di- 
ferenças e então identificar aquelas consideradas fora de 
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um intervalo razoável. O tamanho deste intervalo deve 
ser baseado não apenas nas diferenças reais, mas nos fato- 
res discutidos anteriormente (empenho do respondente, 
método de coleta de dados e contexto da pesquisa), que 
impactam sobre a possibilidade de inversões. 

O objetivo de qualquer análise de inversões é identifi- 
car padrões consistentes de inversões que apontem para 
uma representação inválida de uma estrutura de preferên- 
cia. Apesar de um pesquisador esperar que nenhuma in- 
versão ocorra, elas podem surgir ocasionalmente e ainda 
fornecer uma estrutura válida de preferência. É o traba- 
lho do pesquisador considerar todos os fatores discutidos, 
bem como a extensão das inversões para cada responden- 
te, e identificar aqueles respondentes com uma quantia 
inadequada de inversões. 


Ações corretivas para inversões. A despeito de a pre- 
sença de inversões não invalidar necessariamente um 
conjunto de estimativas de utilidades parciais, a pesquisa 
deve considerar fortemente uma série de ações corretivas 
para garantir a adequação dos resultados e maximizar a 
habilidade preditiva das utilidades parciais. Quando dian- 
te de um número substancial de inversões, o pesquisador 
tem várias opções: 


e Não fazer coisa alguma. Muitas vezes uma pequena quantia 
de inversões pode ser ignorada, particularmente se o foco 
for sobre os resultados agregados. Muitos pesquisadores su- 
gerem que se mantenham essas inversões como uma medida 
de inconsistência do mundo real. A razão é que as inversões 
serão compensadas durante a agregação. 

e Aplicar restrições. Restrições podem ser aplicadas no pro- 
cesso de estimação visando à proibição de inversões [3, 109]. 
A especificidade dessas restrições varia de métodos simples 
de criação de um “empate” para os níveis envolvidos (ou 
seja, dar a eles a mesma estimativa de utilidade parcial) até 
a monotonicidade dentro e ao longo de atributos [107]. Po- 
de-se ver também os modelos lineares ou de ponto ideal de 
utilidades parciais discutidos anteriormente. 

Ainda que estudos mostrem que a precisão preditiva 
pode ser melhorada com tais restrições, o pesquisador deve 
também avaliar o grau em que elas potencialmente distor- 
cem as preferências em relações pré-definidas. Assim, onde 
quer que restrições possam ser utilizadas para corrigir a in- 
versão ocasional, seria inadequado utilizar restrições para 
corrigir níveis ou atributos incorretamente especificados 
mesmo que a precisão preditiva melhore. 

e Eliminar respondentes. Uma ação corretiva final envolve a 
eliminação, da análise, de respondentes com substanciais 
quantias de inversões. O que está em jogo aqui é a pon- 
deração entre reduzir representatividade e diversidade da 
amostra através da eliminação versus a inclusão de estru- 
turas inválidas de preferência. Novamente, o pesquisador 
deve ponderar os custos em relação aos benefícios ao tomar 
tal decisão. 


Sempre deve-se tomar cuidado toda vez que o pesquisa- 
dor afeta diretamente as utilidades parciais estimadas. Ape- 
sar de a ausência de inversões atingir um senso de validade 


pela correspondência com as relações teorizadas, o pesqui- 
sador deve se certificar de não impor restrições que possam 
obscurecer resultados válidos mas contra-intuitivos. Com 
qualquer ação corretiva para inversões, o pesquisador tam- 
bém deve estar consciente das implicações não apenas sobre 
estimativas de utilidades parciais individuais, mas sobre des- 
crições gerais de preferência vistas em resultados agregados 
ou outras aplicações (p.ex., segmentação, simuladores de 
escolha). 


Resumo 

Um dos elementos únicos da análise conjunta é a habilidade 
de representar a estrutura de preferência de indivíduos atra- 
vés de utilidades parciais, ainda que muitos pesquisadores 
esqueçam de validar essas estruturas de preferência. Como 
discutido anteriormente, pode se conseguir uma boa visão 
a partir de tal exame, e ainda o potencial para melhorar os 
resultados gerais pela correção de padrões inválidos entre 
as utilidades parciais. É de interesse do próprio pesquisador 
o exame minucioso dos resultados para cada indivíduo para 
garantir relevância prática e a validade da estrutura de pre- 
ferência antes de utilizá-los em análise posterior. 


Avaliação da importância relativa de atributos 


Além de retratar o impacto de cada nível com as estimativas 
de utilidades parciais, a análise conjunta pode avaliar a im- 
portância relativa de cada fator. Como as estimativas de uti- 
lidades parciais geralmente são convertidas em uma escala 
comum, a maior contribuição para a utilidade geral — e, por- 
tanto, o fator mais importante — é o fator com a maior ampli- 
tude (do nível baixo ao nível alto) de utilidades parciais. Os 
valores de importância de cada fator podem ser convertidos 
em percentuais que somam 100% dividindo-se cada ampli- 
tude de fator pela soma de todas as amplitudes. 


Usando nosso exemplo anterior de utilidades parciais esti- 
madas com três atributos, o cálculo de importância é como 
se segue. Primeiro, descubra a amplitude (valor máximo 
menos valor mínimo) por atributo. Em seguida, divida 
cada valor de amplitude pelo total para obter o valor de 
importância. 


Atributo Mínimo Máximo Amplitude Importância 
1 — 0,657 0,098 0,755 22,8% 
2 — 0,756 0,302 1,058 32,0% 
3 — 0,826 0,667 1,493 45,2% 
Total 3,306 100,0% 


Neste caso, o terceiro atributo explica quase metade 
da variação (1,493/3,306 = 0,452) nos escores de utilidade, 
ainda que os outros dois atributos sejam menores (32,0% e 
22,8%). Podemos então dizer que para este respondente, o 
atributo 3 é duas vezes tão importante quanto o atributo 1 
na obtenção dos escores de utilidade e de preferências. 
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Isso viabiliza a comparação entre respondentes usando 
uma escala comum, bem como dá significado à magnitu- 
de do escore de importância. O pesquisador sempre deve 
considerar o impacto sobre os valores de importância de 
um nível extremo ou praticamente impossível. Se tal ní- 
vel é encontrado, ele deve ser eliminado da análise ou os 
valores de importância devem ser reduzidos para refletir 
apenas a amplitude de níveis possíveis. 


ESTÁGIO 6: VALIDAÇÃO DOS 
RESULTADOS CONJUNTOS 


Resultados conjuntos podem ser validados interna e ex- 
ternamente. A validação interna envolve a confirmação 
de que a regra de composição selecionada (isto é, aditiva 
versus interativa) é apropriada [19]. Em geral, o pesquisa- 
dor é limitado a avaliar empiricamente a validade somen- 
te da forma do modelo escolhido em um estudo completo, 
devido às altas demandas da coleta de dados para testar 
os dois modelos. Este processo de validação é realizado 
com mais eficiência comparando-se modelos alternativos 
(aditivo versus interativo) em um estudo de pré-teste para 
confirmar qual modelo é adequado. Já discutimos o uso 
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Interpretação e validação de resultados conjuntos 


e Resultados devem ser estimados para cada indivíduo a 
menos que: 

e O modelo conjunto exija estimativas agregadas (ou 
seja, algumas formas de análise conjunta baseada em 
escolha) 

A população seja conhecida como homogênea com 
nenhuma variação entre estruturas individuais de 
preferência 

Estimativas de utilidades parciais são geralmente 

escalonadas em uma base comum para comparação 

entre respondentes 

Padrões teoricamente inconsistentes de utilidades 

parciais, conhecidos como inversões, podem originar 

eliminação de um respondente a menos que: 

e À ocorrência dos mesmos seja mínima 

e Restrições sejam aplicadas para proibir inversões 

Importância de atributo deve ser obtida com base nas 

amplitudes relativas de utilidades parciais para cada 

atributo 

Validação deve acontecer em dois níveis: 

e Validação interna: Testar se foi escolhida a regra 
adequada de composição (isto é, aditiva ou 
interativa) e se é feita em um pré-teste de estudo 
Validação externa: Avaliar a validade preditiva 
dos resultados em um ambiente real no qual o 
pesquisador sempre deve garantir que a amostra é 
representativa da população em estudo 


de estímulos de validação para avaliar a precisão preditiva 
para cada indivíduo ou para a amostra de validação de 
respondentes se a análise é executada no nível agregado. 

A validação externa em geral envolve a habilidade da 
análise conjunta para prever escolhas reais e, em termos 
específicos, a questão da representatividade da amostra. 
Embora a análise conjunta tenha sido empregada em nu- 
merosos estudos nos últimos 20 anos, relativamente pou- 
ca pesquisa tem se concentrado em sua validade externa. 
Um estudo confirmou que a análise conjunta aproxima-se 
muito dos resultados do teste de conceito tradicional, uma 
metodologia aceita para prever a preferência de clientes 
[105], enquanto outros estudos demonstraram a precisão 
preditiva para compras de eletrônicos e artigos de merce- 
aria pelos clientes [37, 76]. Apesar de não haver avaliação 
de erro amostral nos modelos de nível individual, o pesqui- 
sador sempre deve garantir que a amostra seja representa- 
tiva da população de estudo [72]. Essa representatividade 
se torna especialmente importante quando os resultados 
conjuntos são usados para fins de segmentação ou simu- 
lação de escolha (ver a próxima seção para uma discussão 
mais detalhada desses usos de resultados conjuntos). 


APLICAÇÕES GERENCIAIS 
DE ANALISE CONJUNTA 


Normalmente, os modelos conjuntos estimados no nível 
individual (modelo separado por indivíduo) são empre- 
gados em uma ou mais das seguintes áreas: segmentação, 
análise de lucratividade e simuladores conjuntos. Além 
dos resultados individuais, resultados agregados conjun- 
tos podem representar grupos de indivíduos e também 
fornecer um meio de prever suas decisões para qualquer 
número de situações. A única vantagem da análise con- 
junta é a habilidade de representar as preferências para 
cada indivíduo de uma maneira objetiva (p.ex., utilidades 
parciais). No sentido mais fundamental, a análise con- 
junta pode ajudar a identificar necessidades de clientes, 
a dar prioridade a essas necessidades e então traduzi-las 
na forma de estratégias reais [67, 90, 98]. As aplicações 
gerenciais e acadêmicas mais comuns de análise conjunta 
junto com sua representação da estrutura de preferência 
do cliente incluem segmentação, análise de lucratividade 
e simuladores conjuntos. 


Segmentação 

Um dos usos mais comuns de resultados de análise con- 
junta individual é agrupar respondentes com utilidades 
parciais ou valores de importância semelhantes para iden- 
tificar segmentos. As utilidades parciais conjuntas estima- 
das podem ser usadas sozinhas ou em combinação com 
outras variáveis (p.ex., demográficas) para deduzir agru- 
pamentos de respondentes que são mais semelhantes em 
suas preferências [20, 26]. 
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No exemplo do detergente industrial, poderíamos 
primeiramente agrupar indivíduos com base em seus 
escores de importância de atributo, encontrando um 
grupo para o qual a marca é a característica mais im- 
portante, ao passo que um outro grupo poderia valo- 
rizar mais o preço. Outra abordagem seria o exame 
direto dos escores de utilidade parcial, novamente 
identificando indivíduos com padrões similares de es- 
cores ao longo de cada um dos níveis dentro de um ou 
mais atributos. 


Para o pesquisador interessado em conhecer a presença 
de tais grupos e sua magnitude relativa, várias abordagens 
para segmentação, que diferem em vantagens e desvanta- 
gens, estão disponíveis [66, 109]. Uma abordagem lógica 
é a aplicação de análise de agrupamentos (ver Capítulo 8) 
para as estimativas de utilidades parciais ou para os esco- 
res de importância para cada atributo a fim de identificar 
subgrupos homogêneos de respondentes. A análise con- 
junta tem sido proposta também como um meio de vali- 
dar análise de segmentação formada com outras variáveis 
de agrupamento, onde diferenças em estruturas conjuntas 
de preferência são utilizadas para demonstrar distinção 
entre os segmentos [18]. 


Análise de lucratividade 


Um complemento à decisão de projeto de produto é uma 
análise de lucratividade marginal do projeto proposto 
para o produto. Se o custo de cada característica é conhe- 
cido, o custo de cada produto pode ser combinado com a 
participação de mercado e o volume de vendas esperados 
para prever sua viabilidade. Esse processo pode identificar 
combinações de atributos que seriam mais lucrativas mes- 
mo com uma participação menor no mercado, por causa 
do baixo custo de componentes particulares. Um adjunto 
da análise de lucratividade é a avaliação de sensibilidade a 
preço [45], a qual pode ser abordada por meio de projetos 
de pesquisa específicos [81] ou programas especializados 
[92]. Tanto resultados individuais quanto agregados po- 
dem ser usados nessa análise. 


Simuladores conjuntos 


Neste ponto, o pesquisador ainda entende apenas a im- 
portância relativa dos atributos e o impacto de níveis es- 
pecíficos. Mas como a análise conjunta atinge seu outro 
objetivo primário de usar análise do tipo “o que aconte- 
ceria se” para prever a participação de preferências que 
um estímulo (real ou hipotético) está apto a capturar em 
vários cenários competitivos de interesse para a adminis- 
tração? Esse papel é desempenhado pelos simuladores de 
escolha, os quais permitem ao pesquisador simular qual- 
quer número de cenários competitivos e então estimar 
como os respondentes reagiriam a cada cenário. 


Condução de uma simulação 

Uma simulação conjunta é uma tentativa de compreen- 
der como o conjunto de respondentes escolheria em um 
conjunto especificado de estímulos. Este processo fornece 
ao pesquisador a habilidade de usar as utilidades parciais 
estimadas na avaliação de qualquer número de cenários 
consistindo de diferentes combinações de estímulos. Para 
qualquer cenário dado, o pesquisador segue um processo 
de três passos: 


Passo 1: Especificar o(s) cenário(s). Depois que o mo- 
delo conjunto é estimado, o pesquisador pode especificar 
qualquer número de conjuntos de estímulos para simu- 
lação de escolhas de clientes. Entre os possíveis cenários 
que podem ser avaliados estão os seguintes: 


e Impactos de se acrescentar um produto a um mercado exis- 
tente 

e Potencial ampliado a partir da estratégia de um multipro- 
duto ou de uma multimarca, incluindo estimativas de cani- 
balismo 

e Impactos de se eliminar um produto ou marca do mercado 

e Delinceamentos ótimos de produtos para um mercado espe- 
cífico 


Em cada caso, o pesquisador fornece o conjunto de 
estímulos que representam os objetos (produtos, serviços 
etc.) disponíveis no cenário do mercado sob estudo, e as 
escolhas de respondentes são então simuladas. O valor 
singular de se usar análise conjunta nas simulações é que 
múltiplos cenários podem ser avaliados e os resultados 
podem ser compilados para cada respondente através da 
sua estrutura de preferência de utilidades parciais. 


Passo 2: Simular escolhas. Uma vez que os cenários es- 
tão completos, as utilidades parciais para cada indivíduo 
são usadas para prever as escolhas ao longo dos estímu- 
los em cada cenário. Simuladores de escolha garantem ao 
pesquisador a habilidade de avaliar qualquer número de 
cenários, mas o verdadeiro benefício envolve a capacida- 
de do pesquisador de especificar condições ou relações 
entre os estímulos para representar condições de mercado 
de forma mais realista. Por exemplo, os objetos compe- 
tirão igualmente com todos os demais? A similaridade 
entre os objetos cria diferentes padrões de preferência? 
As características não-medidas do mercado podem ser in- 
cluídas na simulação? Estas questões são apenas algumas 
entre muitas que devem ser tratadas para se acrescentar 
o nível necessário de realismo ao simulador de escolhas, 
para retratar um mercado válido no qual respondentes fa- 
zem escolhas. 

Apesar de pesquisadores terem trabalhado extensi- 
vamente para captar muitos dos efeitos observados ante- 
riormente, pelo menos três tipos básicos [37] devem ser 
incluídos: 


e Impacto diferencial: O impacto de qualquer atributo/nível 
é o mais importante quando o respondente valoriza aquele 
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objeto entre os dois do topo, indicando seu papel na escolha 
real entre esses objetos. 

e Substituição diferencial: A similaridade entre objetos afeta a 
escolha com objetos parecidos compartilhando preferência 
geral (p.ex., quando se escolhe entre pegar um ônibus ou 
dirigir um carro, acrescentar ônibus de cores diferentes não 
aumenta a chance de se pegar um ônibus; os dois objetos 
compartilhariam a chance geral de se pegar um ônibus). 

e Melhoramento diferencial: Dois objetos extremamente pareci- 
dos do mesmo tipo básico podem ser distinguidos por peque- 
nas diferenças em um atributo que é relativamente inconse- 
quente quando se comparam dois objetos de tipos distintos. 


Examinemos um conjunto de cinco produtos hipotéticos 
para ilustrar tais efeitos. Considere que os cinco produtos 
estão na categoria de sucos de fruta, com duas subclasses: 
sem e com gás carbônico. As marcas A, Be C são sem 
gás carbônico, enquanto as marcas D e E têm gás. Cal- 
culamos valores de utilidade para as marcas, com A e B 
mostrando valores de 30 e 40, respectivamente, enquanto 
as demais marcas (C, D e E) têm todas o valor 10. 

Agora olhemos como cada tipo de efeito impacta um 
simulador de escolha. Primeiro, o impacto diferencial se 
refere ao fato de que mudar os níveis de atributo nas mar- 
cas A e B tem o maior impacto, pois essas duas marcas 
apresentam o maior valor, onde uma pequena mudança 
poderia ser suficiente para fazer a balança pender para 
alguma delas. A substituição diferencial se refere ao fato 
de que acrescentar um novo produto gaseificado causará 
impacto nas marcas D e E de maneira desproporcional, 
pois elas são mais parecidas com o novo produto do que 
as marcas não-gaseificadas. Finalmente, o melhoramento 
diferencial implica que as marcas D e E, por serem mais 
assemelhadas, serão mais facilmente comparadas em 
qualquer atributo do que quando se comparar qualquer 
uma delas (D ou E) com as demais marcas. 


Esses efeitos tentam retratar algumas das regras de es- 
colha mais complexas que afetam decisões de clientes. A 
habilidade de simuladores de escolha de representar essas 
relações permite que os pesquisadores retratem mais rea- 
listicamente as forças atuando no conjunto de objetos sob 
consideração no cenário. Além disso, precisão preditiva é 
sensivelmente melhorada com uma melhor compreensão 
sobre o comportamento de mercado inerente dos respon- 
dentes [37, 78]. 


Passo 3: Calcular a participação de preferência. O úl- 
timo passo em simulação conjunta é prever preferência 
para cada indivíduo e então calcular participação de pre- 
ferência para cada estímulo agregando as escolhas indi- 
viduais. Simuladores de escolha podem usar uma vasta 
gama de regras de escolha [25] na previsão para qualquer 
indivíduo: 
e Modelo de utilidade máxima (primeira escolha). Este mo- 
delo assume que o respondente escolhe o estímulo com o 


maior escore de utilidade previsto. A participação de prefe- 
rência é determinada pelo cálculo do número de indivíduos 
preferindo cada estímulo. Esta abordagem é mais adequada 
para situações com indivíduos de preferências amplamente 
distintas e em situações envolvendo compras esporádicas, 
não-rotineiras. 

e Modelo de probabilidade de preferência. Neste, previsões de 
probabilidade de escolha somam 100% no conjunto de estí- 
mulos testados, com cada pessoa tendo alguma probabilidade 
de comprar cada estímulo. Participação geral de preferência 
é medida somando-se as probabilidades de preferência ao 
longo de todos os respondentes. Esta abordagem, que pode 
aproximar alguns elementos de similaridade de produtos, é 
mais apropriada para situações de compras repetitivas, para 
as quais compras podem ser mais associadas com situações 
de uso ao longo do tempo. Os dois métodos mais comuns de 
se fazerem essas previsões são os modelos BTL (Bradford- 
Terry-Luce) e logit, que fazem previsões muito parecidas em 
quase todas as situações [36]. 

e Primeira escolha ao acaso. Desenvolvido pela Sawtooth Soft- 
ware [73, 78], este método procura combinar o melhor das 
duas abordagens anteriores. Tira amostras de cada respon- 
dente múltiplas vezes, cada vez acrescentando variação ale- 
atória nas estimativas de utilidade para cada estímulo. Para 
cada iteração, ele aplica a regra da primeira escolha e então 
totaliza os resultados para cada F individual para conseguir 
uma participação de preferência por respondente. Ele corrige 
similaridade de produtos e pode ser refinado pela especifica- 
ção da quantia e tipo de variação ao acaso que melhor apro- 
xima as participações conhecidas de preferência [37, 75]. 


Resumo. A participação de preferência, determinada 
por qualquer um dos três métodos descritos, fornece uma 
visão sobre muitos fatores inerentes às escolhas reais de 
respondentes. Múltiplos cenários de produtos podem ser 
avaliados, dando origem não apenas a uma perspectiva de 
qualquer cenário em particular, mas da dinâmica na parti- 
cipação de preferência conforme os estímulos variam. 

O pesquisador deve acautelar-se em qualquer aplica- 
ção do simulador conjunto ao assumir que a participação 
de preferência em uma simulação conjunta se traduz di- 
retamente em participação de mercado [15]. A simulação 
conjunta representa apenas o produto e talvez aspectos de 
preço de administração de marketing, omitindo todos os 
outros fatores de marketing (p.ex., anúncio e promoção, 
distribuição, respostas competitivas) que acabariam cau- 
sando impacto sobre a participação de mercado. Não obs- 
tante, a simulação conjunta apresenta uma visão do mer- 
cado do produto e da dinâmica de preferências que podem 
ser vistos na amostra em estudo. 


METODOLOGIAS CONJUNTAS 
ALTERNATIVAS 
Até este ponto, lidamos com aplicações de análise conjun- 


ta que envolvem a metodologia conjunta tradicional. Mas 
as aplicações no mundo real muitas vezes envolvem de 20 
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a 30 atributos ou demandam uma tarefa de escolha mais 
realista do que a usada em nossas discussões anteriores. 
Pesquisas recentes, direcionadas para superar esses pro- 
blemas encontrados em muitos estudos conjuntos, con- 
duziram ao desenvolvimento de duas novas metodologias 
conjuntas: (1) uma análise conjunta adaptativa/auto-expli- 
cada para lidar com um grande número de atributos e (2) 
uma análise conjunta baseada em escolhas para fornecer 
tarefas de escolha mais realistas. Essas áreas representam 
o principal foco de pesquisa recente em análise conjunta 
[14,29, 63]. 


Análise conjunta adaptativa/auto-explicada: 
conjunta com um grande número de fatores 


Os métodos do perfil completo e de trocas começam a se 
tornar intratáveis quando envolvem mais de 10 atribu- 
tos, ainda que muitos estudos conjuntos precisem incor- 
porar até 20, 30 ou mesmo mais atributos. Nesses casos, 
uma forma adaptada ou reduzida de análise conjunta é 
empregada para simplificar o esforço de coleta de dados 
e ainda representar uma decisão de escolha realista. As 
duas opções são os modelos auto-explicados e os modelos 
adaptativos ou híbridos. 


Modelos conjuntos auto-explicados 

No modelo auto-explicado, o respondente fornece uma 
avaliação sobre quão desejável é cada nível de um atri- 
buto e então avalia a importância relativa do atributo em 
geral. Utilidades parciais são então calculadas por uma 
combinação dos dois valores [99]. Nessa abordagem com- 
posicional, são feitas avaliações sobre as componentes de 
utilidade, em vez de apenas preferência geral. Por ser uma 
variante importante da análise conjunta e mais próxima 
de modelos multiatributos tradicionais, este modelo gera 
diversas preocupações: 


e Os respondentes podem avaliar a importância relativa de 
atributos com precisão? Um problema comum com auto- 
avaliações é o potencial para importância ser subestimado 
em modelos multiatributos porque os respondentes querem 
dar respostas socialmente desejáveis. Em tais situações, o 
modelo conjunto resultante também é tendencioso. 

e Correlações interatributos podem ter um papel maior e 
provocar vieses substanciais nos resultados devido à dupla 
contagem de fatores correlacionados. Modelos conjuntos 
tradicionais sofrem deste problema também, mas a abor- 
dagem auto-explicada é particularmente afetada porque os 
respondentes jamais devem considerar explicitamente esses 
atributos em relação a outros. 

e Finalmente, respondentes jamais executam uma tarefa de 
escolha (avaliando o conjunto de combinações hipotéticas 
de atributos), e essa falta de realismo é uma limitação críti- 
ca, especialmente em aplicações de novos produtos. 


Pesquisas recentes têm demonstrado que esse méto- 
do pode ter habilidade preditiva adequada quando com- 
parado com métodos conjuntos tradicionais [27]. Esta 


abordagem é melhor usada quando modelos agregados 
são preferidos, pois idiossincrasias individuais podem ser 
compensadas nos resultados agregados. Logo, se o núme- 
ro de fatores não pode ser reduzido a um nível aceitável 
com o qual possa ser tratado por qualquer dos outros mé- 
todos conjuntos, então um modelo auto-explicado pode 
ser um método alternativo viável. 


Modelos conjuntos adaptativos ou híbridos 

Uma segunda abordagem é o modelo adaptativo, ou híbri- 
do, assim chamado por combinar o modelo auto-explicado 
com o modelo conjunto de utilidades parciais [23, 24]. Ele 
utiliza valores auto-explicados para criar um pequeno sub- 
conjunto de estímulos selecionados de um delineamento 
fatorial fracionário. Os estímulos são então avaliados de 
uma maneira semelhante à análise conjunta tradicional. 
Os conjuntos de estímulos diferem entre respondentes, e 
apesar de cada respondente avaliar apenas uma pequena 
quantia, todos os estímulos são avaliados coletivamente 
por uma parte dos respondentes. A abordagem de integrar 
a informação do respondente para simplificar ou aumentar 
as tarefas de escolha tem conduzido a diversos esforços de 
pesquisas recentes que têm por meta diferentes aspectos 
do delineamento de pesquisa [3, 44, 101, 106]. 

Uma das mais populares variantes dessa abordagem é 
ACA, um programa conjunto desenvolvido pela Sawtooth 
Software [87]. ACA emprega avaliações auto-explicadas 
para reduzir o tamanho do projeto fatorial e tornar o pro- 
cesso mais maleável. É particulamente útil quando o estu- 
do inclui um grande número de atributos não apropriado 
para as outras abordagens. Aqui o programa primeiro cole- 
ta avaliações auto-explicadas de cada fator. Em seguida es- 
sas avaliações são usadas na geração de estímulos tais que 
os fatores menos importantes são rapidamente eliminados 
dos estímulos. Além disso, cada estímulo contém apenas 
um pequeno número de fatores (de três a seis) para man- 
ter a tarefa de escolha melhor administrável. Este processo 
adaptativo só pode ser conseguido através do programa as- 
sociado, tornando esta abordagem inapropriada para qual- 
quer tipo de projeto não-interativo (p.ex., consultas por es- 
crito). No entanto, sua flexibilidade de acomodar grandes 
quantias de atributos com tarefas simples de escolha tem 
tornado o mesmo um dos métodos mais amplamente uti- 
lizados. Além disso, sua habilidade preditiva relativa tem 
se mostrado comparável à análise conjunta tradicional, 
tornando-o assim uma alternativa apropriada quando o nú- 
mero de atributos é grande [27, 47, 105, 115, 119]. 


Escolha entre modelos auto- 

explicado e adaptativo/híbrido 

Quando nos deparamos com um número de fatores que 
não pode ser acomodado nos métodos conjuntos discuti- 
dos até o presente momento, os modelos auto-explicado 
e adaptativo ou híbrido preservam pelo menos uma par- 
te dos princípios inerentes à análise conjunta. Ao com- 
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parar essas duas extensões, os métodos auto-explicados 
têm uma confiabilidade ligeiramente menor, apesar de 
desenvolvimentos recentes poderem fornecer alguma 
melhora. Quando os métodos dos modelos híbrido e 
auto-explicado são comparados com técnicas de perfil 
completo, os resultados são confundidos, com desempe- 
nho um pouco superior do método híbrido ou adaptati- 
vo, particularmente ACA [38]. Apesar de mais pesquisa 
ser necessária para confirmar as comparações entre os 
métodos, os estudos empíricos indicam que os métodos 
adaptativos ou híbridos e as mais novas formas de mo- 
delos auto-explicados oferecem alternativas viáveis em 
relação à análise conjunta tradicional quando lidamos 
com muitos fatores. 


Análises conjuntas baseadas em escolhas: 
acréscimo de outro toque de realismo 


Nos últimos anos, muitos pesquisadores na área de análi- 
se conjunta têm direcionado seus esforços para uma nova 
metodologia conjunta que forneça maior realismo na ta- 
refa de escolha. Com o objetivo prioritário de compreen- 
der o processo de tomada de decisão do respondente e 
prever o comportamento no mercado, a análise conjunta 
tradicional considera que a tarefa de julgamento, baseada 
em ordenamento ou avaliação, capta as escolhas do res- 
pondente. Entretanto, pesquisadores argumentam que 
essa não é a forma mais realista de descrever um processo 
de decisão real do respondente, e outros apontam para a 
falta de teoria formal que conecte esses julgamentos me- 
didos com escolha [59]. 

O que surgiu é uma metodologia conjunta alterna- 
tiva, conhecida como conjunta baseada em escolhas, 
com a validade inerente de pedir ao respondente para 
escolher um estímulo de perfil completo a partir de um 
conjunto de estímulos alternativos conhecido como 
conjunto escolha. Isso é muito mais representativo do 
real processo de selecionar um produto a partir de um 
conjunto de produtos competitivos. Além disso, a análi- 
se conjunta baseada em escolhas fornece uma opção de 
não escolher qualquer um dos estímulos apresentados 
ao incluir uma opção de não-escolha no conjunto esco- 
lha. Enquanto a análise conjunta tradicional considera 
que as preferências dos respondentes sempre serão alo- 
cadas em meio ao conjunto de estímulos, a abordagem 
baseada em escolhas permite a contração do mercado 
se todas as alternativas em um conjunto escolha care- 
cem de atrativos. 


Uma ilustração simples de perfil completo 

versus conjunta baseada em escolhas 

Antes de discutirmos alguns dos detalhes mais técnicos da 
análise conjunta baseada em escolhas e de como ela difere 
das outras metodologias conjuntas, examinemos primei- 
ramente as diferenças na criação de estímulos e então ve- 
jamos o processo real de coleta de dados. 


Criação de estímulos. A primeira diferença entre per- 
fil completo e conjunta baseada em escolhas é o tipo 
de estímulos. Ambos usam uma forma de estímulo de 
perfil completo, mas a tarefa de escolha é bastante di- 
ferente. Examinemos um exemplo simples para fins de 
ilustração. 


Uma companhia de telefones celulares deseja estimar o 
potencial de mercado para três opções de serviço que 
podem ser acrescentadas na taxa de serviço básico de 
$14,95 por mês e de $0,50 por minuto de ligação: 


ICA Chamadas listadas com uma taxa de serviço de 
$2,75 por mês 
CW Espera de chamada com uma taxa de serviço de 
$3,50 por mês 
TWC Chamada com três linhas com uma taxa de ser- 
viço de $3,50 por mês 


Estímulos de perfil completo. A análise conjunta 
tradicional é realizada com estímulos de perfil com- 
pleto representando as diversas combinações de ser- 
viços, variando do serviço básico até o serviço básico 
com as três opções. O conjunto completo de perfis 
(planejamento fatorial) é exibido na Tabela 7-7. O 
estímulo 1 representa o serviço básico sem opções, o 
estímulo 2 é o serviço básico mais o serviço de cha- 
madas listadas, e assim por diante até o estímulo 8, 
que corresponde ao serviço básico mais as três opções 
(chamadas listadas, espera de chamada e chamada 
com três linhas). 


Estímulos baseados em escolhas. Em uma aborda- 
gem baseada em escolha, apresenta-se ao responden- 
te uma série de conjuntos escolha. Cada conjunto es- 
colha tem diversos estímulos de perfil completo. Um 
projeto baseado em escolhas também é mostrado na 
Tabela 7-7. O primeiro conjunto escolha consiste de 
cinco dos estímulos de perfil completo (estímulos 1, 
2,4,5 e 6) e uma opção do tipo “nenhum deles”. O 
respondente então escolhe apenas um dos perfis no 
conjunto escolha (“mais preferido” ou “mais deseja- 
do”) ou a opção “nenhuma escolha”. Um exemplo de 
tarefa de conjunto escolha para o conjunto 6 é exibido 
na Tabela 7-8. A preparação de estímulos e conjuntos 
escolha é baseada nos princípios de delineamento ex- 
perimental [44, 59] e é objeto de considerável esforço 
de pesquisa para refinar e melhorar a tarefa de esco- 
lha [3, 14,40, 44,81]. 


Coleta de dados. Dadas as diferentes maneiras como 
estímulos são formados, as tarefas de escolha diante do 
respondente são bastante distintas. Como veremos, o pes- 
quisador deve escolher entre uma tarefa de escolha mais 
simples no método de perfil completo e a tarefa baseada 
em escolha que é mais realista. 
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TABELA 7-7 Uma comparação de planejamentos de estímulos usados em análises conjuntas tradicional e baseada em 


escolhas 
ANÁLISE CONJUNTA TRADICIONAL 
Níveis de fatores” Conjunta baseada em escolhas 
Estímulo ICA cw TWC Conjunto escolha Estímulos no conjunto escolha” 
1 0 0 0 1 1,2,4,5, 6, e nenhuma escolha 
2 1 0 0 2 2,3,5,6, 7, e nenhuma escolha 
3 0 1 0 3 1,3,4,6, 7, 8, e nenhuma escolha 
4 0 0 1 4 2,4,5, 7, 8, e nenhuma escolha 
5 1 1 0 5 3,5, 6, 8, e nenhuma escolha 
6 1 0 0 6 4, 6, 7, e nenhuma escolha 
7 0 1 1 x 1,5, 7, 8, e nenhuma escolha 
8 1 1 1 8 1,2, 6, 8, e nenhuma escolha 
9 


1,2,83, 7, e nenhuma escolha 
2,3, 4, 8, e nenhuma escolha 
1,83, 4, 5, e nenhuma escolha 


ml 
Ss 


“Níveis: 1 = opção de serviço incluída; O = opção de serviço não-incluída. 


“Estímulos usados em conjuntos escolha são aqueles definidos no planejamento para a análise conjunta tradicional. 


Método de perfil completo. Para a abordagem de perfil 
completo, o respondente é solicitado a avaliar ou orde- 
nar cada um dos oito perfis. O respondente avalia cada 
estímulo separadamente e fornece uma avaliação de 
preferências. A tarefa é relativamente simples e pode ser 
realizada muito rapidamente após umas poucas tarefas 
de aquecimento. Como anteriormente discutido, quando 
o número de fatores e níveis aumenta (lembre de nosso 
exemplo anterior de quatro fatores com quatro níveis 
cada, gerando-se 256 estímulos), a tarefa pode se tornar 
muito grande e exigir alguma forma de subconjunto de 
estímulos, que ainda pode ser substancial. 


Método baseado em escolha. Para a abordagem ba- 
seada em escolhas, o número de perfis pode ou não va- 
riar ao longo dos conjuntos escolha [59]. Além disso, 
a quantia de escolhas feitas (uma para cada um dos 11 
conjuntos escolha) é, na verdade, maior neste caso do 
que o exigido neste exemplo. No entanto, quando o nú- 
mero de fatores e níveis aumenta, o delineamento ba- 
seado em escolhas demanda consideravelmente menos 
avaliações. 


Resumo. As vantagens da abordagem baseada em es- 
colhas são o realismo adicional e a habilidade de estimar 
termos de interação. Depois que cada respondente esco- 
lheu um estímulo para cada conjunto escolha, os dados 
podem ser analisados no nível desagregado (responden- 
tes individuais) ou agregado ao longo dos respondentes 
(segmentos ou alguns outros agrupamentos homogêneos 
de respondentes) para estimar as utilidades parciais con- 
juntas para cada nível e os termos de interação. A partir 
desses resultados, podemos avaliar as contribuições de 
cada fator e a interação fator-nível e estimar as possíveis 
participações de mercado de perfis concorrentes. 


Características únicas de análise 

conjunta baseada em escolhas 

A natureza básica da análise conjunta baseada em esco- 
lhas e seus antecedentes no campo teórico de integração 
de informação [58] levou a uma perspectiva um pouco 
mais técnica do que a encontrada nas outras metodologias 
conjuntas. Embora as outras metodologias sejam basea- 
das em experimentos válidos e princípios estatísticos, a 
complexidade adicional em delineamentos de estímulos 
e estimação tem causado muitos esforços no desenvol- 
vimento nessas áreas. A partir desses esforços, os pes- 
quisadores agora têm uma compreensão mais clara das 
questões envolvidas em cada estágio. As seções a seguir 
detalham algumas das áreas e questões nas quais a análise 
conjunta baseada em escolhas é única entre as metodolo- 
gias conjuntas. 


Tipo de processo de tomada de decisão retratada. A 
análise conjunta tradicional sempre foi associada a uma 
abordagem intensiva de informações para tomada de de- 
cisões, pois ela envolve o exame dos estímulos de perfil 
completo compostos de níveis de cada atributo. Cada 
atributo é igualmente representado e considerado em 
um único perfil. Mas na análise conjunta baseada em es- 
colhas, os pesquisadores estão chegando à conclusão de 
que a tarefa de escolha pode invocar um tipo diferente 
de processo de tomada de decisão. Ao escolherem en- 
tre estímulos, os clientes parecem fazê-lo em meio a um 
subconjunto menor de fatores em relação ao qual com- 
parações e, afinal, escolhas são feitas [39]. Isso caminha 
paralelamente com os tipos de decisões associadas a es- 
tratégias simplificadoras ou restritas a tempo, cada uma 
caracterizada por uma menor profundidade de proces- 
samento. Logo, cada metodologia conjunta fornece di- 
ferentes visões sobre o processo de tomada de decisões. 
Como os pesquisadores podem não querer selecionar 
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TABELA 7-8 Exemplo de um conjunto escolha em análise conjunta baseada em escolhas 


Qual sistema de chamada você escolheria? 


1 2 


3 4 


Sistema de base a $14,95/mês e 

$0,05/minuto mais: 

e ICA: chamadas listadas a 
$2,75/mês 


Sistema de base a $14,95/mês e 

$0,05/minuto mais: 

e TWC: chamada com três linhas 
por $3,50/mês 


Sistema de base a $14,95/mês e 

$0,05/minuto mais: 

e CW: espera de chamada a 
$3,50/mês e 

e TWC: chamada com três linhas 
a $3,50/mês 


Nenhum destes 


apenas uma metodologia, uma estratégia emergente é 
empregar ambas e extrair perspectivas únicas de cada 
uma [39, 80]. 


Delineamento de conjunto escolha. Talvez a maior van- 
tagem da análise conjunta baseada em escolhas seja o pro- 
cesso realista de escolha representado pelo conjunto esco- 
lha. Desenvolvimentos recentes melhoraram ainda mais a 
tarefa de escolha, permitindo relações adicionais dentro 
do modelo de escolha a ser analisado enquanto se aumen- 
ta a efetividade do delineamento do conjunto escolha: 


e Um esforço recente mostrou como o conjunto de escolha 
pode ser criado para garantir equilíbrio não entre níveis de 
fatores, mas entre as utilidades dos estímulos [40]. A esco- 
lha mais realista e informativa ocorre entre alternativas pro- 
ximamente comparáveis, e não na situação em que um ou 
mais estímulos são sensivelmente inferiores ou superiores. 
No entanto, o processo de delineamento de estímulos é ti- 
picamente focado na meta de ortogonalidade e equilíbrio 
entre os atributos. Isso fornece uma tarefa mais realista, 
criando estímulos com níveis de utilidade mais compará- 
veis, aumentando o envolvimento do cliente e fornecendo 
melhores resultados. 

e Uma opção na criação de um conjunto escolha é a alterna- 
tiva "nenhuma escolha", na qual o respondente tem a opor- 
tunidade de escolher nenhuma das opções especificadas 
[32]. Esta possibilidade dá ao respondente um nível extra 
de realismo enquanto também fornece ao pesquisador uma 
maneira de estabelecer efeitos absolutos e relativos. 

e Muitas vezes, devem ser acomodados elementos específi- 
cos da tarefa de escolha, como pares proibidos, efeitos es- 
pecíficos de níveis, ou efeitos cruzados entre níveis (como 
marcas), que demandam tarefas de escolha especialmente 
planejadas que são mais facilmente conseguidas através da 
análise conjunta baseada em escolhas [16, 85]. Além disso, 
em um método envolvendo informação adicional dos res- 
pondentes, são criados conjuntos escolha que ajustam as 
preferências únicas de cada indivíduo e atingem uma me- 
lhor precisão preditiva em situações de mercado [12]. 


Cada um desses desenvolvimentos são característicos 
dos esforços pretendidos ao se melhorar a tarefa de esco- 
lha em análise conjunta baseada em escolhas para conferir 
um método mais realista e eficiente de avaliar preferência 
de clientes. 


Técnica de estimação. A fundamentação conceitual da 
análise conjunta baseada em escolhas é a psicologia [60, 


104], mas foi o desenvolvimento da técnica de estimação 
logit multinomial [64] que forneceu um método operacio- 
nal para estimar esses tipos de modelos de escolha. Ape- 
sar de esforços consideráveis terem refinado a técnica e 
tornado a mesma amplamente disponível, ela ainda re- 
presenta uma metodologia mais complexa do que aquelas 
associadas a outras metodologias conjuntas. 

A abordagem baseada em escolha foi originalmente 
estimada apenas no nível agregado, mas desenvolvimen- 
tos têm permitido a formação de modelos no nível de seg- 
mentos (conhecidos como modelos de classe latente) e até 
mesmo modelos individuais através de estimação bayesia- 
na [6, 56, 91, 103]. Este desenvolvimento estimulou uma 
adoção até mais ampla de métodos baseados em escolhas, 
viabilizando modelos desagregados mais propícios para 
emprego em simuladores de escolha e outras aplicações. 

Um aspecto particular que ainda não está resolvido em 
modelos agregados ou no uso de simuladores de escolha é 
a propriedade de IIA (independência de alternativas irre- 
levantes), uma suposição que torna problemática a previ- 
são de alternativas semelhantes. Apesar de a exploração 
de todas as questões inerentes a IIA estar além do escopo 
dessa discussão, deve-se advertir o pesquisador quando 
usar modelos de nível agregado estimados pela análise 
conjunta baseada em escolhas para entender as ramifica- 
ções dessa suposição. 


Algumas vantagens e limitações da 

análise conjunta baseada em escolhas 

A crescente aceitação da análise conjunta baseada em es- 
colhas entre praticantes da pesquisa de marketing deve-se 
principalmente à crença de que a obtenção de preferên- 
cias por meio de respondentes que escolhem um único 
estímulo de um conjunto de estímulos é mais realista — 
e, portanto, um método melhor — para se aproximar de 
processos de decisão reais. Entretanto, o realismo acres- 
centado pela tarefa de escolha é acompanhado de várias 
negociações que o pesquisador deve considerar antes de 
selecionar a análise conjunta baseada em escolhas. 


A tarefa de escolha. Cada conjunto escolha contém 
diversos estímulos, e cada estímulo, diversos fatores em 
diferentes níveis, semelhantes aos estímulos de perfil 
completo. Portanto, o respondente deve processar uma 
quantidade consideravelmente maior de informação do 
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que em outras metodologias conjuntas ao fazer uma es- 
colha em cada conjunto escolha. A Sawtooth Software, 
criadora do sistema de análise conjunta baseada em es- 
colhas (CBC), acredita que as escolhas que envolvem 
mais que seis atributos provavelmente irão confundir e 
sobrecarregar o respondente [88]. Apesar de o método 
baseado em escolha imitar decisões reais com mais fi- 
delidade, a inclusão de muitos atributos cria uma tarefa 
formidável que termina com menos informação do que 
teria sido obtida por meio da avaliação de cada estímulo 
individualmente. 


Precisão preditiva. Na prática, as três metodologias con- 
juntas permitem tipos parecidos de análises, simulações e 
relatos, ainda que os processos de estimação sejam dife- 
rentes. Os modelos baseados em escolhas ainda têm de 
estar sujeitos a testes empíricos mais completos, apesar de 
alguns pesquisadores acreditarem que eles têm vantagem 
para prever o comportamento de escolha, particularmente 
quando modelos no nível de segmentos ou agregados são 
desejados [108]. Contudo, testes empíricos indicam pouca 
diferença entre modelos baseados em avaliações em nível 
individual ajustados para levar em conta as não-escolhas e 
os modelos multinomiais generalizados logit baseados em 
escolhas [68]. 

Na comparação das duas abordagens (baseadas em 
avaliações ou em escolhas) em termos da habilidade de 
prever participações de mercado em uma amostra de 
validação no nível individual [21], ambas prevêem bem 


REGRAS PRÁTICAS 7-7 


Modelos conjuntos alternativos 


e Quando 10 ou mais atributos são incluídos na variável 
estatística conjunta, dois modelos alternativos 
encontram-se disponíveis: 

e Modelos adaptativos podem facilmente acomodar 
até 30 atributos, mas requerem uma entrevista via 
computador 
Modelos auto-explicados podem ser feitos através de 
qualquer forma de coleta de dados, mas representam 
um desvio de métodos conjuntos tradicionais 

Modelos conjuntos baseados em escolhas tornaram-se 

o formato mais popular de todos, ainda que eles não 

acomodem geralmente mais do que seis atributos, com 

popularidade baseada em: 

e Uso de uma tarefa realista de escolha para seleção 
dos estímulos de maior preferência a partir de um 
conjunto escolha de estímulos, incluindo uma opção 
do tipo "nenhuma escolha" 

Habilidade para estimar mais facilmente efeitos de 
interação 

Disponibilidade crescente de programas 
computacionais, particularmente com opções 
bayesianas de estimação 


escolhas da amostra de validação, com nenhuma técnica 
dominante e os resultados se misturando em diferentes 
situações. No fim, a decisão de usar um método no lugar 
do outro é ditada pelos objetivos e pelo escopo do estu- 
do, pela familiaridade do pesquisador com cada método, 
e pelo software disponível para analisar adequadamente 
os dados. 


Aplicações administrativas. Modelos baseados em es- 
colha estimados no nível agregado fornecem os valores 
e a significância estatística de todas as estimativas, facil- 
mente produzem previsões realistas de participações de 
mercado para novos estímulos [44, 108] e fornecem as 
garantias extras de que as “escolhas” entre os estímu- 
los foram usadas para calibrar o modelo. No entanto, os 
modelos conjuntos de escolha agregados impedem a seg- 
mentação do mercado. O desenvolvimento de segmenta- 
ção ou mesmo de modelos de nível individual foi a res- 
posta a tal necessidade [56, 103, 111]. A capacidade deles 
de representar termos de interação e complexas relações 
entre atributos fornece uma visão melhor dos processos 
reais de escolha e das relações agregadas esperadas vis- 
tas através de simuladores de escolha. No entanto, para 
a maioria das situações básicas de escolha, os modelos 
baseados em avaliação descritos anteriormente são ade- 
quados para estudos de segmentação e para a simulação 
de participações de escolha. Novamente, o pesquisador 
deve decidir sobre o nível de realismo versus a comple- 
xidade desejada em qualquer aplicação de análise con- 
junta. 


Disponibilidade de programas de computador. A boa 
notícia é que para pesquisadores estão agora disponíveis 
diversos programas baseados em escolha que auxiliam 
em todas as fases do projeto da pesquisa, da estimação do 
modelo e da interpretação [42, 88]. A notícia ruim é que 
as recentes pesquisas de acadêmicos e de pesquisadores 
aplicados estão sendo integradas lentamente a esses pro- 
gramas disponíveis comercialmente. Muitos dos avanços 
em pesquisa ainda são encontrados apenas em um domí- 
nio limitado e não estão disponíveis para amplo uso. Es- 
ses aperfeiçoamentos e competências melhoradas, após 
rigorosa validação da comunidade científica, deverão se 
tornar uma parte padrão de todos os programas baseados 
em escolhas. 


Resumo 

A análise conjunta baseada em escolha é uma metodo- 
logia emergente que promete aumentar as capacidades 
interpretativas e preditivas da análise conjunta. O amplo 
interesse e pesquisa nos melhoramentos em quase todas 
as áreas da metodologia fornecerão os fundamentos ne- 
cessários para o crescimento contínuo, a disponibilidade 
e a aceitação desse método. Isso acrescentará um compo- 
nente distinto ao kit de ferramentas do pesquisador para 
compreender as preferências do consumidor. 
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Visão geral das três metodologias conjuntas 


A análise conjunta evoluiu, desde sua origem, a partir do 
que agora conhecemos como análise conjunta tradicio- 
nal, para desenvolver duas metodologias adicionais, que 
abordam duas questões substanciais: lidar com grandes 
números de atributos e tornar a tarefa de escolha mais 
realista [774]. Cada metodologia tem características dis- 
tintas que ajudam a definir as situações nas quais é mais 
aplicável (veja nossa discussão anterior no estágio 2). 
Entretanto, em muitas situações, duas ou mais metodo- 
logias são adequadas, e o pesquisador tem a opção de 
selecionar uma ou, mais frequentemente técnicas com- 
binadas. Somente conhecendo as vantagens e desvanta- 
gens de cada método é que o pesquisador pode fazer a 
escolha mais apropriada. Os pesquisadores interessados 
em análise conjunta são encorajados a continuar a mo- 
nitorar os desenvolvimentos dessa técnica multivariada 
amplamente empregada. 


UMA ILUSTRAÇÃO DE 
ANALISE CONJUNTA 


Nesta seção examinamos os passos em uma aplicação de 
análise conjunta para produzir um problema de delinea- 
mento. A discussão segue o processo de construção de 
modelo introduzido no Capítulo 1 e se concentra (1) no 
delineamento dos estímulos, (2) na estimação e interpre- 
tação das utilidades parciais conjuntas, e (3) na aplica- 
ção de um simulador conjunto para prever participações 
de mercado para a formulação de um novo produto. O 
módulo CONJOINT do SPSS é usado nas fases de deli- 
neamento, análise e simulador de escolha desse exemplo 
[97]. Resultados comparáveis são obtidos com os outros 
programas conjuntos disponíveis para uso acadêmico e 
comercial. A base de dados de respostas conjuntas está 
disponível na Web em www.bookman.com.br. 


Estágio 1: Objetivos da análise conjunta 


A análise conjunta, como discutido anteriormente, tem 
sido efetivamente aplicada em situações de desenvolvi- 
mento de produtos que exigem (1) uma compreensão de 
preferências de clientes sobre atributos e (2) um método 
para simular resposta de clientela a vários planejamentos 
de produtos. Através da aplicação da análise conjunta, 
pesquisadores podem desenvolver estimativas agregadas 
(p.ex., nível de segmentos) de preferências de clientes ou 
estimativas de modelos desagregados (ou seja, nível indi- 
vidual) a partir das quais podem ser obtidos segmentos. 


A HBAT estava seriamente considerando o planeja- 
mento de um novo detergente industrial para uso não 
somente em sua própria indústria, mas em muitas fá- 
bricas. Ao desenvolver o conceito do produto, a HBAT 


queria uma compreensão mais direta das necessidades e 
preferências de seus clientes industriais. Assim, em um 
estudo adjunto àquele descrito no Capítulo 1, a HBAT 
escolheu entre 86 clientes industriais para um experi- 
mento de análise conjunta. 

Antes que o estudo conjunto real fosse executado, 
equipes internas de pesquisa de mercado, em consulta 
com o grupo de desenvolvimento do produto, identifi- 
caram cinco fatores como os atributos determinantes no 
segmento alvo do mercado do detergente industrial. Os 
cinco atributos são mostrados na Tabela 7-9. A pesquisa 
com grupos de interesse confirmou que esses cinco atri- 
butos representam os principais determinantes de valor 
em um detergente industrial para este segmento, per- 
mitindo assim que a fase de delineamento prossiga com 
melhor especificação dos atributos e de seus níveis. 


Estágio 2: Projeto da análise conjunta 


As decisões nesta fase são (1) selecionar a metodologia 
conjunta a ser empregada, (2) delinear os estímulos a se- 
rem avaliados, (3) especificar a forma do modelo básico e 
(4) selecionar o método de coleta de dados. 


Seleção de uma metodologia conjunta 

A primeira questão a ser resolvida é a seleção da me- 
todologia conjunta entre as três opções — tradicional, 
adaptativa/híbrida ou baseada em escolhas. A escolha 
do método deve se sustentar não apenas em considera- 
ções de planejamento (p.ex., número de atributos, tipo 
de administração de levantamento etc.), mas também na 
adequação da tarefa de escolha para a decisão de produ- 
to sob estudo. 


Dado o pequeno número de fatores (cinco), as três me- 
todologias seriam adequadas. Como a ênfase era em 
uma compreensão direta da estrutura de preferência e 
a decisão foi prevista como uma de elevado envolvimen- 
to do cliente, a metodologia escolhida foi a tradicional, 
adequada em termos de carga de resposta sobre o res- 
pondente e profundidade de informação representada. 
A análise conjunta baseada em escolhas também foi 
fortemente considerada, mas a ausência de interações 
propostas e o desejo de reduzir a complexidade de tare- 
fa levaram à seleção do método conjunto tradicional. A 
abordagem adaptativa não foi fortemente considerada, 
dado o pequeno número de atributos e o desejo de utili- 
zar métodos tradicionais de levantamento, como aqueles 
por escrito. 


Delineamento de estímulos 

Com o método tradicional de perfil completo selecionado, 
o próximo passo envolve o delineamento de estímulos. 
Apesar de os atributos já terem sido escolhidos, o pesqui- 
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TABELA 7-9 Atributos e níveis para o experimento de análise conjunta HBAT envolvendo planejamento 


de um detergente industrial 


Descrição do atributo Níveis 
Forma do produto Líquido pré-misturado Líquido concentrado Pó 
Número de aplicações por frasco 50 100 200 
Adição de desinfetante ao detergente Sim Não 
Formulação biodegradável Não Sim 
Preço por aplicação típica 35 centavos 49 centavos 79 centavos 


sador deve tomar muito cuidado durante este estágio ao 
especificar os níveis de atributos para operacionalizar os 
atributos no planejamento dos estímulos. Entre as consi- 
derações a serem abordadas estão a natureza dos níveis 
(garantindo que eles são acionáveis e comunicáveis), a 
magnitude e o intervalo dos níveis para cada atributo, e o 
potencial para correlação inter-atributos. 


Pré-teste. Finalmente, um pré-teste de pequena escala 
e um estudo de avaliação foram conduzidos para garan- 
tir que as medidas foram compreendidas e representa- 
ram alternativas razoáveis quando formadas nos estímu- 
los. Os resultados indicaram nenhum problema com os 
níveis, permitindo assim que o processo continuasse. 


Definição de níveis. A primeira consideração é garan- 
tir que cada nível seja acionável e comunicável. A pes- 
quisa de grupo de foco estabeleceu níveis específicos 
para cada atributo (ver Tabela 7-9). Cada um dos níveis 
foi planejado para (1) empregar terminologia usada na 
indústria e (2) representar aspectos do produto rotinei- 
ramente especificados em decisões de compra. 


Magnitudes e amplitudes dos níveis. Os três atributos 
de Forma do Produto, Desinfetante e Biodegradabilida- 
de apenas retratam características específicas; dois atri- 
butos precisam de um exame complementar quanto à 
adequação dos intervalos dos níveis. Primeiro, Número 
de Aplicações varia de 50 a 200. Dada a forma escolhida 
do produto, esses níveis foram escolhidos para resul- 
tarem nos casos típicos de embalagens encontradas no 
ambiente industrial, variando de frascos pequenos para 
indivíduos a containers maiores normalmente associa- 
dos com operações centralizadas de manutenção. 

A seguir, os três níveis de Preço por Aplicação foram 
determinados a partir do exame de produtos existentes. 
Desse modo, eles foram considerados realistas e repre- 
sentando os preços mais comuns do mercado corrente. 
Deve ser observado que os níveis de preço são conside- 
rados monotônicos (ou seja, têm uma ordenação), mas 
não lineares, pois os intervalos (diferenças entre níveis) 
não são consistentes”. 


Correlação inter-atributos. O tipo de produto não 
sugere fatores intangíveis que contribuiriam com cor- 
relação inter-atributos, e os atributos foram especifi- 
camente definidos para minimizarem tal correlação. 
Todas as possíveis combinações de níveis foram exa- 
minadas para se identificar qualquer combinação ina- 
dequada e nenhuma foi encontrada. 


* N.deR.T.: A frase correta seria “não são constantes”. 


Especificação da forma básica do modelo 

Com os níveis especificados, o pesquisador deve a seguir 
especificar o tipo de forma de modelo a ser usada. Fazen- 
do isso, duas questões críticas devem ser abordadas: (1) 
se interações devem ser representadas entre os atributos, 
e (2) o tipo de relação entre os níveis (utilidade parcial, 
linear ou quadrática) para cada atributo. 


Forma do modelo. Após cuidadosa consideração, os 
pesquisadores da HBAT estavam confiantes ao assu- 
mir que uma regra de composição aditiva era adequada. 
Apesar de a pesquisa ter mostrado que frequentemente 
o preço tem interações com outros fatores, foi considera- 
do que os outros fatores eram razoavelmente ortogonais 
e que não eram necessários termos de interação. Essa 
suposição permitiu o uso de modelos agregados ou desa- 
gregados quando necessário. 


Relações de utilidade parcial. Três dos atributos (For- 
ma do Produto, Aplicações por Frasco e Preço por Apli- 
cação) têm mais de dois níveis, exigindo desse modo 
uma decisão sobre o tipo de relação de utilidades par- 
ciais a ser empregada. O atributo Forma do Produto re- 
presenta distintos tipos de produtos, e assim estimativas 
separadas de utilidades parciais são apropriadas. O atri- 
buto Aplicação por Frasco também apresenta três níveis, 
apesar de não terem intervalos iguais. Logo, estimativas 
separadas de utilidades parciais também foram usadas 
aqui. Finalmente, preço também foi especificado com 
estimativas separadas de utilidades parciais, pois os in- 
tervalos não são constantes entre níveis. 

Desses três fatores, somente Preço por Aplicação foi 
especificado como monotônico, por conta da relação im- 
plicada com preço. Forma do Produto representa níveis 
separados sem ordem pré-concebida. O fator Aplicações 
por Frasco não foi considerado monotônico, apesar de 


(Continua) 
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(Continuação) 
os níveis serem definidos em termos numéricos (p.ex., 50 
aplicações por frasco). Nesta situação, nenhum conheci- 
mento anterior levou os pesquisadores a proporem que 
as utilidades parciais devessem aumentar ou diminuir 
consistentemente ao longo desses níveis. 


Seleção do método de coleta de dados 

O passo final no delineamento da análise conjunta gira 
em torno da coleta real de preferências dos responden- 
tes. Fazendo-se isso, diversos pontos devem ser tratados, 
incluindo a seleção do método de apresentação, a criação 
real dos estímulos e a identificação de quaisquer estímulos 
inaceitáveis, selecionando-se uma medida de preferência 
e finalizando o procedimento de administração do levan- 
tamento. Cada uma dessas questões é discutida a seguir. 


Seleção de método de apresentação. Para garantir 
realismo e permitir o uso de avaliações no lugar de or- 
denações, a HBAT decidiu utilizar o método de perfil 
completo para obtenção de avaliações de respondentes. 
As abordagens de troca e de pares não foram utilizadas 


devido à sua falta de realismo ao não se considerarem 
todos os atributos em cada estímulo. Um método híbri- 
do ou adaptativo não foi necessário devido ao número 
relativamente pequeno de fatores. Um método com base 
em escolha teria sido igualmente adequado, dado o nú- 
mero menor de atributos e o realismo da tarefa de esco- 
lha, mas o método de perfil completo acabou sendo es- 
colhido por conta da necessidade de resultados aditivos 
desagregados com o método mais simples de estimação. 


Planejamento de estímulos. Escolhendo a regra adi- 
tiva, pesquisadores foram capazes também de usar um 
planejamento fatorial fracionário para evitar a avaliação 
das 108 combinações possíveis (3x 3x 2x 2x3). O com- 
ponente de planejamento de estímulo do programa com- 
putacional gerou um conjunto de 18 descrições de perfil 
completo (ver Tabela 7-10), permitindo a estimação dos 
efeitos principais ortogonais para cada fator. Quatro es- 
tímulos adicionais foram gerados para servirem como 
estímulos de validação. Nenhum dos estímulos foi consi- 
derado inaceitável depois de serem examinados quanto 


a realismo e adequação à questão de pesquisa. 
(Continua) 


TABELA 7-10 Conjunto de 18 estímulos de perfil completo usado no experimento de análise conjunta de HBAT para o planejamento de um 


detergente industrial 


Níveis de atributos 


Estímulo nº Forma do produto Número de aplicações Qualidade desinfetante Forma biodegradável Preço por aplicação 


Estímulos usados na estimação de utilidades parciais 


1 Concentrado 200 Sim Não 35 centavos 
2 Pó 200 Sim Não 35 centavos 
3 Pré-misturado 100 Sim Sim 49 centavos 
4 Pó 200 Sim Sim 49 centavos 
5 Pó 50 Sim Não 79 centavos 
6 Concentrado 200 Não Sim 79 centavos 
7 Pré-misturado 100 Sim Não 79 centavos 
8 Pré-misturado 200 Sim Não 49 centavos 
9 Pó 100 Não Não 49 centavos 
10 Concentrado 50 Sim Não 49 centavos 
1 Pó 100 Não Não 35 centavos 
12 Concentrado 100 Sim Não 79 centavos 
13 Pré-misturado 200 Não Não 79 centavos 
14 Pré-misturado 50 Sim Não 35 centavos 
15 Concentrado 100 Sim Sim 35 centavos 
16 Pré-misturado 50 Não Sim 35 centavos 
17 Concentrado 50 Não Não 49 centavos 
18 Pó 50 Sim Sim 79 centavos 
Estímulos de validação 
19 Concentrado 100 Sim Não 49 centavos 
20 Pó 100 Não Sim 35 centavos 
21 Pó 200 Sim Sim 79 centavos 
22 Concentrado 50 Não Sim 35 centavos 
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(Continuação) ] 
Coletadas preferências dos respondentes. O experi- 


mento de análise conjunta foi aplicado durante uma 
entrevista pessoal. Após a coleta de alguns dados preli- 
minares, os respondentes receberam um conjunto de 22 
cartões, cada um contendo uma das descrições de estí- 
mulo de perfil completo. Uma medida de avaliação de 
preferência foi conseguida apresentando a cada respon- 
dente um formulário com sete categorias de resposta, 
variando de “de forma alguma eu compraria” até “certa- 
mente compraria”. Os respondentes foram instruídos a 
colocar cada cartão na categoria de resposta que melhor 
descrevesse suas intenções de compra. Após inicialmen- 
te colocarem os cartões, eles foram solicitados a reverem 
suas colocações e rearranjarem cartões, se necessário. Os 
estímulos de validação foram avaliados ao mesmo tem- 
po que os outros estímulos, mas retirados da análise no 
estágio de estimação. Ao fim, o entrevistador registrou a 
categoria para cada cartão e prosseguiu com a entrevis- 
ta. Um total de 86 respondentes completou com sucesso 
toda a tarefa conjunta. 


Estágio 3: Suposições na análise conjunta 


A suposição relevante em análise conjunta é a especifica- 
ção da regra de composição e, assim, a forma de modelo 
usada para estimar os resultados conjuntos. Essa avalia- 
ção deve ser baseada em termos conceituais, bem como 
questões práticas. 


Nessa situação, a natureza do produto, a tangibilidade 
dos atributos e a falta de apelos intangíveis ou emo- 
cionais justificam o emprego de um modelo aditivo. A 
HBAT se sentiu confiante para usar um modelo aditi- 
vo para essa situação de tomada de decisão industrial. 
Além disso, esse modelo simplificou o delineamento dos 
estímulos e facilitou os esforços de coleta de dados. 


Estágio 4: Estimação do modelo conjunto 
e avaliação do ajuste geral do modelo 


Com as tarefas conjuntas especificadas e as respostas cole- 
tadas, o próximo passo é utilizar a abordagem apropriada 
de estimação para obter as estimativas de utilidade parcial 
e então avaliar a qualidade geral do ajuste. Fazendo isso, 
o pesquisador deve considerar não apenas as respostas 
usadas na estimação, mas também aquelas coletadas para 
fins de validação. 


Estimação do modelo 

Sabendo-se que a medida de preferência usada era mé- 
trica, pode-se empregar a abordagem tradicional baseada 
em regressão ou a nova metodologia bayesiana. Como o 
planejamento fatorial fracionário forneceu estímulos sufi- 


cientes para estimação de modelos desagregados, a abor- 
dagem tradicional foi empregada. No entanto, deve ser 
notado que a estimação bayesiana teria sido igualmente 
apropriada, particularmente porque efeitos adicionais de 
interação eram desejados. 


A estimação de utilidades parciais de cada atributo foi 
primeiramente executada para cada respondente sepa- 
radamente, e os resultados foram então agregados para 
se obter um resultado geral. Estimativas separadas de 
utilidades parciais foram inicialmente feitas para todos 
os níveis, com exame das estimativas individuais empre- 
endido para se examinar a possibilidade de se colocarem 
restrições na forma de relação de um fator (ou seja, em- 
pregar uma forma de relação linear ou quadrática). A 
Tabela 7-11 mostra os resultados para a amostra geral, 
bem como para os primeiros cinco respondentes no con- 
junto de dados. O exame dos resultados gerais sugere 
que talvez uma relação linear pudesse ser estimada para 
a variável preço (ou seja, os valores de utilidade par- 
cial diminuem de 1,13 para 0,08 e para —1,21 à medida 
que o preço por aplicação sobe de 35 para 49 e para 79 
centavos). No entanto, uma revisão dos resultados indi- 
viduais mostra que apenas três dos cinco respondentes 
(107, 123 e 135) tinham estimativas de utilidades parciais 
para fatores de preço que eram de um padrão geralmen- 
te linear. Para o respondente 129, o padrão era essen- 
cialmente estável e o respondente 110 tinha um padrão 
um tanto ilógico, no qual utilidades parciais na verdade 
aumentavam quando se ia de 49 para 79 centavos. Logo, 
a aplicação de uma forma linear para o fator de preço 
iria distorcer gravemente a relação entre níveis, e a esti- 
mação de valores de utilidades parciais separados para o 
atributo de Preço por Aplicação foi mantida. 


Avaliação da qualidade do ajuste 

Para resultados desagregados e agregados, três medi- 
das de qualidade do ajuste são fornecidas. Preferência 
foi medida usando-se avaliações (dados métricos); logo, 
correlações de Pearson foram calculadas para a amos- 
tra de estimação. Os valores de avaliação também foram 
convertidos para ordenações, e uma medida tau de Ken- 
dall foi calculada. A amostra de teste tinha apenas qua- 
tro estímulos, e assim a qualidade de ajuste, para fins de 
validação, usou somente a medida de ordenação do tau 
de Kendall. 

Ao contrário de muitas outras técnicas multivariadas, 
quando se avaliam resultados desagregados nenhum tes- 
te direto de significância estatística avalia as medidas de 
qualidade de ajuste acima descritas. Podemos usar, po- 
rém, níveis de correlação geralmente aceitos para avaliar 
qualidade de ajuste nas fases de estimação e de validação. 
Ao se estabelecer qualquer referência para avaliar as me- 
didas de qualidade do ajuste, o pesquisador deve observar 


coco 'c— coc/'0— vvr6's 299L'0— 29940 Z99L'0— 29940 LLL9'O 688€'0— cccc'o- LLL9'O 688€'0- coco 0— 
LLLL'O 9550'0— 9550'0— ge80'o geso'0— Z9Ly'0— Z9Lv'0 LELLO 9550'0— 9550'0— 9550'0— LELL'O 9550'0— 
LLL9'T— 95s0'0 959s'a Ztys'o ZLys'o— Z9Lv'0 Z9Ly'0— cccc') acoc'o birpr'o— coco O 688g'0 LLL9'0— 
8225'0 6888'0— LLL9'O gess'o gess'0— Z99L'0— 29940 prrr'o 688€'0— 9590'0- LLLL'O 9595'0— brrr'o 
688g'c— vrre'o brpr'l 2 LpS'0— Z2LpS'O €80c'0 €805'0— 9550'|— LLL9'O prrr'o 99595'0— LLL9'O 99550'0— 
(sjusaweandodsa, 'cg| o 6€L 'gzl OLL 'Z0L) sopeuoldajos sojuspuodsoy 
celg'|— vL8o'o gLeL'L Lys LO LySL'O— coLS'o— coLS'O Z|eg'0 €eco'o osve'0— voso'o Z2994'0 LZ Lo'0— 
j21ob esouy 
62'0$ 6v'0$ se'og us oeN oeN UWIS 002 00L 0s od opelgusduod opeinysIui-s1d 
ogdeoide 10d 0odeud jongpesbopoig aejuejajuIsag segóeaI|de ap osounN onpoid op gumo 


TViddVd aavalniLn Ja SVALLVWILSI 


406 Análise Multivariada de Dados 


sopeuolos|os sejuepuodss odulo 8 [eJsb esjsouwe e esed ejunfuoo [erosed epepijyn ep seagewnsa LL-Z WIagyL 


CAPÍTULO7 Análise Conjunta 407 


tanto os valores muito baixos quanto os muito altos, pois 
podem indicar respondentes aos quais a tarefa de escolha 
não foi aplicável. 


Avaliação de baixos valores de qualidade do ajuste. Na 
avaliação de baixos valores, a referência óbvia é algum 
valor mínimo de correlação entre os escores reais de pre- 
ferência e os valores de utilidade previstos. Várias pers- 
pectivas podem ser usadas: 


e A primeira vê a distribuição de valores para as medidas de 
qualidade do ajuste. Valores atípicos podem indicar respon- 
dentes aos quais a tarefa de escolha não foi aplicável quan- 
do se compara com os outros respondentes. 

e Segundo, os níveis reais de correlação devem ser conside- 
rados. Com o número tipicamente pequeno de observações 
(estímulos) para cada respondente, uma abordagem seria 
estabelecer algum nível mínimo de correlação, semelhante 
à medida ajustada Rº em regressão multivariada (ver Capí- 
tulo 4 para mais detalhes) 


Neste exemplo, o processo de estimação usou 18 estímu- 
los e cinco atributos como variáveis independentes. Em 
tal situação, um Rº de aproximadamente (0,300 resulta 
em um Rº ajustado de zero. Logo, uma correlação mí- 
nima de 0,55 (a raiz quadrada de 0,300) garantiria que 
o superajuste foi acomodado. O pesquisador também 
pode querer estabelecer um valor de referência mínimo 
que corresponde a um nível de ajuste. Por exemplo, se o 
pesquisador desejasse que o processo de estimação ex- 
plicasse pelo menos 50% da variação, uma correlação de 
0,707 seria necessária. 

Assim, para a amostra de estimação, um nível mí- 
nimo da qualidade do ajuste de 0,55 foi estabelecido 
para a correlação Pearson (de base métrica) com um 
nível desejado de 0,707 (correspondente a um Rº de 
50%). Ao longo dos 86 respondentes, somente três ti- 
nham valores menores que 0,707 e todos eles estavam 
acima do valor de referência mínimo de 0,55 (ver Ta- 
bela 7-12). 

Os valores tau de Kendall, apesar de geralmente 
serem mais baixos em valor, dados seus usos de orde- 
nação no lugar de avaliação, demonstram o mesmo 
padrão geral. Para a amostra de validação, quatro 
respondentes (110, 229, 266 e 372) têm valores tau de 
Kendall particularmente baixos (todos na faixa de 0,40 
ou menos). Apesar de um desses respondentes (266) 
também apresentar baixos valores de estimação, os 
outros três têm valores baixos somente no processo de 
validação. 


Avaliação de valores de qualidade do ajuste muito al- 
tos. Medidas extremamente altas de qualidade do 
ajuste também devem ser examinadas; elas podem in- 
dicar que as tarefas de escolha não captaram o proces- 
so de decisão, o que é parecido com o caso de valores 


extremamente baixos. Por exemplo, valores de 1,0 in- 
dicam que as utilidades parciais estimadas captaram 
perfeitamente o processo de escolha, o que pode acon- 
tecer quando o respondente utiliza somente um peque- 
no número de atributos. Pode indicar também um res- 
pondente que não seguiu o espírito da tarefa e assim 
fornece resultados sem representatividade. A despeito 
de a avaliação de tais valores exigir um certo grau de 
julgamento por parte do pesquisador, é importante ava- 
liar os resultados para cada valor para garantir que eles 
sejam verdadeiramente representativos do processo de 
escolha. 


Três respondentes (225, 396 e 586) foram identificados 
com base em seus valores muito elevados de qualidade 
do ajuste para a amostra de estimação. Os valores de 
qualidade do ajuste para a amostra de estimação são 
0,990, 1,000 e 0,974, respectivamente, e os três têm va- 
lores de qualidade do ajuste de 1,000 para a amostra de 
validação. Assim, todos devem ser examinados para ver 
se as estimativas de utilidade parcial representam estru- 
turas de preferência razoáveis. 

Quando se olha para as estimativas de utilidade par- 
cial, emergem estruturas de preferência bastante dife- 
rentes (ver Tabela 7-13). Para o respondente 225, todos 
os atributos são valorados em algum grau, com Preço 
por Aplicação e Desinfetante sendo os mais importan- 
tes. No entanto, quando examinamos o respondente 396, 
percebemos um padrão totalmente diferente. Apenas 
Preço por Aplicação tem utilidades parciais estimadas, o 
que indica que a decisão foi tomada somente sobre este 
atributo. O respondente 586 colocou alguma importân- 
cia sobre Forma do Produto e Número de Aplicações, 
mas Preço por Aplicação ainda desempenhou um papel 
mais importante. 

Como resultado, o pesquisador deve determinar se 
esses respondentes são mantidos com base na adequa- 
ção de suas estruturas de preferência. Nesta situação, os 
três respondentes serão mantidos. Para o respondente 
225, a estrutura de preferência parece bastante razoável. 
Para os outros dois respondentes, mesmo que suas es- 
truturas de preferência estejam altamente concentradas 
no atributo de Preço por Aplicação, elas ainda represen- 
tam um padrão sensato que refletiria as preferências de 
clientes específicos. 


Avaliação de níveis de qualidade do ajuste de amostra de 
validação. Além disso, o pesquisador deve também exa- 
minar os níveis de qualidade do ajuste para a amostra de 
validação. Aqui, o foco é sobre baixos valores de ajuste, 
uma vez que o número relativamente pequeno de estí- 
mulos faz com que valores maiores sejam possíveis com a 
expectativa razoável de que o modelo estimado se ajuste 
perfeitamente aos estímulos de validação. 


408 Análise Multivariada de Dados 


TABELA 7-12 Medidas de qualidade do ajuste para resultados da análise conjunta 


Amostra de Amostra de 
Amostra de estimação validação Amostra de estimação validação 
Respondente | Pearson | Tau de Kendall | Tau de Kendall | Respondente | Pearson | Tau de Kendall | Tau de Kendall 
107 0,929 0,784 0,707 363 0,947 0,819 0,548 
110 0,756 0,636 0,408 364 0,863 0,760 0,707 
123 0,851 0,753 0,707 366 0,828 0,751 0,548 
129 0,945 0,718 0,816 368 0,928 0,783 0,775 
135 0,957 0,876 0,816 370 0,783 0,690 0,913 
155 0,946 0,736 0,707 372 0,950 0,813 0,183 
161 0,947 0,841 0,913 382 0,705 0,463 0,548 
162 0,880 0,828 0,667 396 1,000 1,000 1,000 
168 0,990 0,848 0,913 399 0,948 0,766 0,913 
170 0,808 0,635 0,667 401 0,985 0,869 0,913 
171 0,792 0,648 0,548 416 0,947 0,762 0,816 
1783 0,920 0,783 0,548 421 0,887 0,732 0,548 
174 0,967 0,785 0,913 422 0,897 0,832 1,000 
181 0,890 0,771 0,913 425 0,945 0,743 0,707 
187 0,963 0,858 0,913 428 0,967 0,834 0,913 
193 0,946 0,820 0,816 433 0,864 0,754 0,548 
194 0,634 0,470 0,913 440 0,903 0,778 0,816 
197 0,869 0,731 0,548 441 0,835 0,666 0,548 
211 0,960 0,839 0,707 453 0,926 0,815 0,913 
222 0,907 0,761 0,707 454 0,894 0,661 0,816 
225 0,990 0,931 1,000 467 0,878 0,798 0,913 
229 0,737 0,582 0,236 471 0,955 0,840 0,707 
235 0,771 0,639 0,775 472 0,899 0,748 0,707 
236 0,927 0,843 0,707 475 0,960 0,875 0,667 
240 0,955 0,735 0,816 476 0,722 0,538 0,775 
260 0,939 0,738 0,775 492 0,944 0,791 0,816 
261 0,965 0,847 0,707 502 0,946 0,832 0,707 
266 0,570 0,287 0,236 507 0,857 0,746 0,548 
271 0,811 0,654 0,707 514 0,924 0,795 0,707 
271 0,843 0,718 0,707 516 0,936 0,850 0,548 
287 0,892 0,744 0,913 518 0,902 0,803 1,000 
300 0,961 0,885 0,707 520 0,888 0,812 0,913 
302 0,962 0,871 0,816 522 0,957 0,903 0,548 
303 0,898 0,821 1,000 528 0,917 0,797 0,816 
309 0,876 0,821 0,800 535 0,883 0,748 0,816 
318 0,896 0,713 0,816 538 0,827 0,665 1,000 
323 0,874 0,762 0,816 557 0,948 0,854 0,913 
336 0,878 0,780 0,667 559 0,900 0,767 0,913 
348 0,949 0,747 0,816 578 0,905 0,726 0,707 
350 0,970 0,861 0,816 580 0,714 0,614 0,913 
354 0,795 0,516 0,707 586 0,974 0,862 1,000 
356 0,893 0,780 0,913 589 0,934 0,679 0,913 
357 0,915 0,730 0,913 592 0,931 0,832 0,913 
Agregado 0,957 0,876 0,816 
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Com todos os respondentes tendo valores de qualidade 
do ajuste para o processo de estimação acima do valor de 
referência, o foco se desvia para o processo de validação. 
Aqui vemos quatro respondentes (110, 229, 266 e 372) 
com baixos valores de qualidade de ajuste. Assim, para 
manter a caracterização mais apropriada das estruturas 
de preferência da amostra, esses quatro respondentes 
serão candidatos para eliminação. A decisão final será 
tomada depois que as utilidades parciais forem examina- 
das quanto a padrões de consistência teórica. 


Resumo 

O processo de estimação do modelo e avaliação de ajuste 
do mesmo requer julgamento sensato por parte do pesqui- 
sador. Alguns respondentes podem ter valores de qualidade 
do ajuste tão baixos que eles acabam sendo facilmente ex- 
cluídos, mas na maioria dos casos o pesquisador deve ava- 
liar aqueles respondentes atípicos e avaliar se eles represen- 
tam estruturas apropriadas de preferência. Fazendo isso, 
considerações são feitas não apenas sobre as estimativas 
individuais de utilidade parcial, mas sobre suas caracteri- 
zações coletivas da estrutura de preferência. Essa avaliação 
deve ser complementada examinando-se a correspondência 
dos padrões de utilidades parciais estimadas com quaisquer 
padrões teóricos que possam estar disponíveis. Discutimos 
este processo com mais detalhes na próxima seção. 


Estágio 5: Interpretação dos resultados 


A primeira tarefa é examinar as utilidades parciais e ava- 
liar se existem inversões (violação de relações monotôni- 
cas) que provocariam a eliminação de algum respondente. 
Para auxiliar nesta tarefa, as utilidades parciais são rees- 
calonadas para fornecerem uma medida de comparação. 
Com quaisquer inversões identificadas, o foco se desvia 
para a interpretação das estimativas das utilidades par- 
ciais e o exame do escore de importância de cada respon- 
dente para os atributos. 


Reescalonamento 

Comparar estimativas de utilidades parciais nos atribu- 
tos e entre respondentes pode às vezes ser difícil dada a 
natureza dos coeficientes estimados. Eles são centrados 
em torno de zero, tornando uma comparação direta difí- 
cil sem qualquer ponto óbvio de referência. Um método 
para simplificar o processo de interpretação é o reescalo- 
namento das utilidades parciais para um padrão em co- 
mum, o que tipicamente envolve um processo de dois pas- 
sos. Primeiro, dentro de cada atributo, a utilidade parcial 
mínima é marcada como zero e as demais são expressas 
como valores acima de zero (o que facilmente se consegue 
acrescentando-se a utilidade parcial mínima a todos os ní- 
veis dentro de cada atributo). Em seguida, as utilidades 
parciais são totalizadas e reescalonadas proporcionalmen- 
te para igualar a 100 vezes o número de atributos. Este 
tipo de reescalonamento não afeta a magnitude relativa 
de qualquer utilidade parcial, mas fornece uma escala em 
comum ao longo de todos os valores de utilidades parciais 
para comparação nos atributos e respondentes. 


A Tabela 7-14 apresenta o processo de reescalonamento 
e os resultados para o respondente 107 no estudo HBAT. 
O processo descrito é usado com um reescalonamento 
tal que a soma das utilidades parciais nos cinco atributos 
é 500. Como mostrado na tabela, o passo 1 restabelece 
cada utilidade parcial dentro de cada atributo como a 
diferença em relação ao menor nível no atributo. De- 
pois, as utilidades parciais são totalizadas e reescalona- 
das para igualar a 500 (100 x 5). Quando reescalonada, a 
menor utilidade parcial em cada atributo tem um valor 
de zero. Outras utilidades parciais agora podem ser com- 
paradas dentro ou entre respondentes, sabendo-se que 
elas estão todas na mesma escala. 


Exame das estimativas de utilidades parciais 

Agora que as utilidades parciais estão re-escalonadas, o 
pesquisador pode examinar as estimativas de utilidades par- 
ciais para cada respondente para compreender não somente 


TABELA 7-14 Reescalonamento de estimativas de utilidades parciais para o respondente 107 


Forma do produto 


Número de aplicações 


Desinfetante Biodegradável Preço por aplicação 


Pré-misturado Concentrado Pó 50 100 200 


Sim Não Não Sim $0,35  $0,49  $0,79 


Estimativas originais de utilidade parcial 


—0,0556 0,6111 -0,5556 0,4444 0,6111 -1,0556 -0,2083 0,2083 0,5417 -0,5417 1,4444 0,9444 -2,3889 
Passo 1. Restabelecimento de utilidades parciais em relação aos níveis mínimos dentro de cada atributo” 
0,5000 1,1667 0,00 1,500 1,6667 | 0,00 0,00 04166 1,0834 0,00 38333 33333 0,00 
Passo 2. Reescalonamento de estimativas de utilidade parcial” 
18,52 43,21 0,00 55,56 61,73 0,00 0,00 15,43 40,13 0,00 141,96 123,46 0,00 


“Utilidade parcial mínima sobre cada atributo somada a outras utilidades parciais daquele atributo [p.ex., a utilidade parcial mínima de forma de produto é 0,5556, 


que, quando somada a um valor pré-misturado (0,5556), se iguala a 0,5000] 


?O total de utilidades parciais restabelecidas é proporcionalmente reescalonado para um total de 500 [p.ex., total de utilidades parciais restabelecidas é 13,50; 
assim, utilidade parcial pré-misturada é reescalonada para 18,52 (0,500/13,50 x 500)] 
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as diferenças entre níveis dentro de um fator ou ao longo 
deles, mas também entre respondentes. Os perfis criados 
para cada respondente baseados nas utilidades parciais 
permitem ao pesquisador que ele rapidamente categorize 
a estrutura de preferência de um respondente ou mesmo 
de conjuntos de respondentes. A despeito de técnicas mais 
sofisticadas poderem ser usadas, como análise de agrupa- 
mentos (ver Capítulo 8 para uma discussão mais detalhada), 
mesmo uma inspeção visual identificará padrões. Se uma re- 
lação monotônica é assumida entre os níveis de um atribu- 
to, então o pesquisador deve também identificar quaisquer 
inversões (ou seja, padrões teoricamente inconsistentes de 
utilidades parciais), como discutido na próxima seção. 


A Figura 7-5 mostra a diversidade de estimativas de utili- 
dades parciais nos cinco atributos para três respondentes 
selecionados (107, 123 e 135), bem como os resultados 
agregados compilados para todos os respondentes. Os 
resultados agregados podem ser imaginados como o res- 
pondente médio, em relação ao qual o pesquisador pode 
ver as estruturas de preferência de cada respondente se- 
paradamente, como retratado pelas utilidades parciais, 
para conquistar visões únicas sobre cada indivíduo. 

Por exemplo, para o atributo Forma do Produto, os 
resultados agregados indicam que Concentrado (utilida- 
de parcial de 28,8) é a forma preferida, seguida de perto 
por Pó (20,1) e então por Pré-misturado (0,0). Quando 
vemos os três respondentes, podemos perceber que o 
de número 123 tem um padrão quase idêntico, apesar 
de apresentar utilidades parciais para Concentrado e Pó 
ligeiramente maiores. Para o respondente 107, Concen- 
trado (43,2) também é o preferido, mas Pré-misturado 
(18,5) é o segundo preferido, seguido por Pó (0,0). O 
respondente 135 tem um padrão quase invertido em re- 
lação aos resultados agregados, com Pó (51,7) sendo o 
mais elevado em todo o conjunto de utilidades parciais 
exibido aqui, e Pré-misturado (8,6) e Concentrado (0,0) 
com valores muito baixos. 

Em retrospecto, podemos ver como os resultados 
agregados retratam o grupo geral, mas também devemos 
estar cientes das diferenças entre respondentes. Para 
apenas estes três respondentes, percebemos que dois 
preferem Concentrado no lugar das demais formas, ape- 
sar de esta também ser a forma de menor valor para ou- 
tro respondente que valoriza mais o Pó. Podemos dizer 
também que Pré-misturado geralmente recebe um valor 
pequeno, apesar de não ser o nível de menor valor para 
todos os respondentes, como poderia ser assumido se so- 
mente os resultados agregados fossem vistos. 


Inversões 

Uma forma específica de exame de utilidades parciais en- 
volve a busca por inversões — aqueles padrões de utilida- 
des parciais que são teoricamente inconsistentes. Como 
observado anteriormente, alguns atributos podem ter pa- 


drões implicados entre as utilidades parciais, relações tipi- 
camente relações monotônicas que definem pelo menos a 
ordem dos níveis em termos de preferência. Por exemplo, 
em um contexto de vendas, distância de percurso deve- 
ria ser monotônica, de modo que lojas mais afastadas são 
menos preferidas do que as mais próximas. Essas relações 
são definidas pelo pesquisador, e devem então ser refleti- 
das nas utilidades parciais estimadas. 


Identificação. A primeira tarefa é rever todos os pa- 
drões de utilidade parcial e identificar qualquer um que 
possa refletir inversões. A abordagem mais direta é o exa- 
me das diferenças entre níveis adjacentes que devam ser 
monotonicamente relacionados. Por exemplo, se o nível 
A é suposto como preferível em relação ao B, então a di- 
ferença entre as utilidades parciais dos níveis A e B (ou 
seja, utilidade parcial do nível A menos a utilidade parcial 
do nível B) deve ser positiva. 


Em nosso exemplo, Preço por Aplicação foi considerado 
monotônico, de modo que aumento do preço por aplica- 
ção deve diminuir a preferência (e portanto as utilidades 
parciais estimadas). Se novamente olharmos a Figura 7-5, 
podemos perceber que os padrões de utilidades parciais 
para respondentes agregados e individuais seguem todos 
o padrão esperado. Apesar de alguma variabilidade ser 
encontrada em cada nível, vemos que o padrão monotôni- 
co (35 centavos é preferido em relação a 49 centavos, com 
79 centavos menos preferido) é mantido. 

Quando inspecionamos o conjunto inteiro de respon- 
dentes, porém, encontramos padrões que parecem indicar 
uma inversão da relação monotônica. A Figura 7-6 ilustra 
tais padrões, bem como um exemplo do comportamen- 
to de utilidades parciais que segue a relação monotônica. 
Primeiro, o respondente 229 tem o padrão esperado, com 
39* centavos como o preferido, seguido de 49 centavos e, 
por último, 79 centavos. O respondente 382 mostra um 
comportamento inesperado entre os dois primeiros ní- 
veis (39* e 49 centavos), onde a utilidade parcial na reali- 
dade aumenta para 49 centavos quando comparada com 
35 centavos. Um segundo exemplo é a inversão entre os 
níveis de 49 e 79 centavos para o respondente 110. Aqui 
encontramos uma diminuição entre 35 e 49 centavos, mas 
em seguida um aumento entre 49 e 79 centavos. 

À medida que olhamos a amostra inteira, diversas 
possíveis inversões podem ser identificadas. A Tabela 
7-15 contém todos os pares de utilidades parciais que exi- 
bem padrões contrários à relação monotônica (ou seja, 
a diferença de utilidades parciais é positiva ao invés de 
negativa ou nula). Sete respondentes tinham potenciais 
inversões quando se consideraram os dois primeiros ní- 
veis (35 e 49 centavos), ao passo que cinco respondentes 
tinham potenciais inversões para os dois últimos níveis 
(49 e 79 centavos). 


* N. de R. T.: O número correto é 35. 
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Padrão teoricamente consistente de 


Inversão entre: 


utilidades parciais em todos os níveis 


Níveis 1 (39* centavos) e 2 (49 centavos) Níveis 2 (49 centavos) e 3 (79 centavos) 


39* centavos 49 centavos 79 centavos 
Categoria 


Respondente 229 Respondente 382 Respondente 110 
200 200 200 
150 — 150 — 150 — 
100 — 100 — 100 — 
50 + 50 + 50 — 


39* centavos 49 centavos 79 centavos 
Categoria 


39* centavos 49 centavos 79 centavos 
Categoria 


FIGURA 7-6 Identificação de inversões. 


Uma questão importante ainda deve ser respondida: 
quão grande uma diferença deve ser para denotar uma 
inversão? Qualquer diferença maior que zero constitui 
teoricamente a relação monotônica. Abordagens subjeti- 
vas e empíricas para a identificação de inversões têm sido 
discutidas. Um pesquisador jamais deve confiar totalmen- 
te em abordagens somente subjetivas ou empíricas, pois 
qualquer uma delas deve atuar apenas como uma orien- 
tação para o julgamento do pesquisador na avaliação da 
adequação das utilidades parciais na representação da es- 
trutura de preferência do respondente. 


Revendo as potenciais inversões na Tabela 7-15, pode- 
mos ver que em cada caso um ou mais respondentes têm 
diferenças de utilidades parciais que são consideravel- 
mente mais altas do que as demais. Por exemplo, nas 
diferenças entre os níveis 1 e 2, o respondente 382 tem 
uma indiferença de 112,68, enquanto a segunda maior 
diferença é de 15,87. Analogamente, para as diferenças 
entre os níveis 2 e 3, os respondentes 110 e 129 têm va- 
lores muito maiores (83,33 e 55,56, respectivamente) do 
que os demais. Se usássemos uma abordagem mais qua- 
litativa para examinarmos a distribuição das diferenças, 
esses três respondentes pareceriam provavelmente cate- 
gorizados como apresentando inversões que justificam 
suas remoções. 

Uma técnica mais quantitativa é o exame estatísti- 
co das diferenças. Apesar de não existir um teste esta- 
tístico disponível, um método é calcular o erro padrão 
das diferenças entre os níveis 1 e2e2e3(7,49€e5,33, 
respectivamente) e usá-los para especificar um inter- 
valo de confiança. Usando um nível de confiança de 
99%, os intervalos de confiança seriam de 19,32 (7,49 
x 2,58) para as diferenças entre os níveis 1 e 2, e de 
13,75 entre os níveis 2 e 3. Aplicando tais resultados 


em torno de uma diferença de zero, percebemos que 
os valores atípicos identificados em nossa inspeção vi- 
sual também ficam fora dos intervalos de confiança. 

A combinação desses dois métodos conduz à iden- 
tificação de três respondentes (382, 110 e 129) com in- 
versões em suas estimativas de utilidades parciais. O 
pesquisador agora encara o trabalho de identificar a 
abordagem para lidar com essas inversões. 


Ações corretivas para inversões e níveis ruins de quali- 
dade do ajuste. Como anteriormente discutido, as três 
ações corretivas básicas para inversão são não fazer coisa 
alguma se as inversões são pequenas o bastante ou se re- 
sultados desagregados são o único foco da análise, aplicar 
restrições no processo de estimação, ou eliminar os res- 
pondentes. A questão sobre inversões é distinta, e a esco- 
lha final para a ação corretiva deve ser combinada a ações 
corretivas para respondentes com baixos níveis de ajuste 
de estimação ou validação. 


Dada a ênfase sobre a estrutura de preferência de respon- 
dentes, a HBAT sentiu que a única ação corretiva apro- 
priada seria a eliminação de respondentes com inversões 
substanciais. Além disso, respondentes também deveriam 
ser eliminados se níveis significativamente baixos de ajus- 
te de estimação ou de validação fossem detectados. Três 
respondentes tinham inversões (110, 129 e 382), enquan- 
to quatro respondentes tinham baixos níveis de ajuste 
do modelo (110, 229, 266 e 372). Apenas um respondente 
falhou em ambos os critérios, mas os seis foram elimina- 
dos, resultando em uma amostra de 80 respondentes. A 
eliminação foi feita para garantir o conjunto mais repre- 


sentativo de respondentes para descrever as estruturas de 
(Continua) 


* N. de R. T.: O número correto é 35. 
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TABELA 7-15 


Identificação de inversões da relação monotônica no atributo de preço por aplicação 


Possíveis inversões entre 
nível 1 (35 centavos) e nível 2 (49 centavos) 


Possíveis inversões entre 
nível 2 (49 centavos) e nível 3 (79 centavos) 


Respondente Diferença de utilidades parciais” Respondente Diferença de utilidades parciais” 

382 112,68 110 83,33 
194 15,87 129 55,56 
580 12,82 194 15,87 
260 12,66 538 12,82 
370 11,90 440 8,77 
336 11,49 

514 9,80 


2A diferença esperada de utilidades parciais é negativa (ou seja, uma queda em utilidade quando você passa de 35 para 49 centavos 
ou de 49 para 79 centavos). Valores positivos indicam uma possível violação da relação monotônica. 


(Continuação) 
preferência, enquanto também se mantém um tamanho 
adequado de amostra. A amostra reduzida será usada 
para interpretação adicional ou análise posterior. 


Cálculo da importância de atributo 

Uma abordagem final para examinar a estrutura de pre- 
ferência de utilidades parciais é calcular importância de 
atributos. Esses valores refletem o impacto relativo que 
cada atributo tem no cálculo de preferência geral (ou seja, 
escores de utilidade). Como anteriormente descrito, esses 
valores são calculados para cada respondente e fornecem 
mais uma base concisa de comparação entre as estruturas 
de preferência de respondentes. 


A Tabela 7-16 compara os valores de importância obti- 
dos de cada atributo para os resultados agregados e desa- 
gregados de três respondentes. Apesar de percebermos 
uma consistência geral nos resultados, cada respondente 
tem aspectos únicos uns em relação aos outros e em re- 
lação aos resultados agregados. As maiores diferenças 
são vistas para o atributo de Preço por Aplicação, apesar 
de uma variação substancial ser também percebida nos 
atributos de Biodegradabilidade e Número de Aplica- 
ções. Apenas esses resultados limitados mostram a vasta 
gama de perfis de utilidade parcial entre os responden- 
tes e destacam a necessidade de uma completa descrição 
das estruturas de preferência nos níveis desagregado e 
agregado. 


Uma extensão da análise conjunta é definir grupos de 
respondentes com estimativas similares de utilidade parcial 
ou de valores de importância dos fatores usando análise 
de agrupamentos. Esses segmentos podem então ter seus 
perfis caracterizados e avaliados quanto a suas estruturas 
únicas de preferência e ao seu potencial de mercado. 


Estágio 6: Validação dos resultados 


O passo final é avaliar a validade interna e externa da ta- 
refa conjunta. Como anteriormente observado, validade 


interna envolve confirmação da regra de composição sele- 
cionada (ou seja, aditiva ou interativa). Uma abordagem 
é comparar modelos alternativos (aditivos versus intera- 
tivos) em um estudo de pré-teste. A segunda abordagem 
é se certificar de que os níveis de ajuste do modelo são 
aceitáveis para cada respondente. Validação externa en- 
volve em geral a habilidade da análise conjunta de pre- 
ver escolhas reais e, em termos específicos, a questão da 
representatividade da amostra. O processo de validação 
com os estímulos de validação é o método mais comum 
para avaliar validade externa, enquanto a garantia de re- 
presentatividade da amostra exige análise fora do proces- 
so de modelagem conjunta. 


Os níveis elevados de precisão preditiva para os estímulos 
de estimação e de validação entre os respondentes confir- 
mam a regra de composição aditiva para esse conjunto de 
respondentes. Em termos de validade externa, o processo 
de validação identificou quatro respondentes com baixos 
níveis de ajuste do modelo, e eles foram excluídos da aná- 
lise. A questão da representatividade da amostra deve 
ser abordada com base no planejamento da pesquisa em 
vez de uma avaliação específica dos resultados conjuntos. 
Nesta situação, a HBAT deve provavelmente proceder 
com um projeto de maior escala com maior cobertura de 
suas bases de clientela para garantir representatividade. 
Outra consideração é a inclusão de não-clientes, espe- 
cialmente se a meta é compreender o mercado como um 
todo, e não apenas os clientes da HBAT. 


Uma aplicação gerencial: uso de 
um simulador de escolha 


Além de compreender as estruturas de preferência agrega- 
da e individual dos respondentes, as estimativas de utilidade 
parcial fornecem um método útil para representar a estru- 
tura de preferência de respondentes usando outras técnicas 
multivariadas (p.ex., o emprego de utilidades parciais ou 
escores de importância de atributos em regressão múltipla 
ou análise de agrupamentos) ou aplicações. Uma aplicação 
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TABELA 7-16 Valores obtidos de importância de atributo para amostra geral e três respondentes selecionados 


Importância derivada de atributo” 


Forma do produto Número de aplicações 


Desinfetante 


Biodegradável Preço por aplicação 


Amostra geral” 


15,1 17,6 18,6 9,6 39,1 
Respondentes selecionados 
107 14,3 20,4 Sil 13,3 46,9 
123 11,4 7,6 9,5 12,4 59,1 
135 12,8 12,8 4,2 4,2 66,0 


?Escores de importância de atributos somam 100 nos cinco atributos para cada respondente. 
"Baseada nos 80 respondentes remanescentes após a eliminação de 6 respondentes como ação corretiva contra inversões e baixo ajuste de modelo. 


específica é o simulador de escolhas, que utiliza as estimati- 
vas de utilidade parcial para fazer previsões de escolha entre 
conjuntos especificados de estímulos. O respondente pode 
construir um conjunto de estímulos para representar qual- 
quer posição competitiva (ou seja, o mercado competitivo 
corrente ou a entrada de um novo produto) e então usar o 
simulador de escolhas para simular o mercado e derivar esti- 
mativas de participações de mercado entre os estímulos. 

O processo de executar uma simulação de escolhas 
envolve três etapas: (1) especificar o cenário, (2) simular 
escolhas e (3) calcular participações de preferências. Cada 
um desses passos é discutido em termos de nosso exemplo 
conjunto do detergente industrial. 


Passo 1: Especificação dos cenários 

A HBAT também usou os resultados conjuntos para si- 
mular escolhas entre três possíveis produtos. Os produ- 
tos eram formulados para identificar se uma nova linha 
de produtos poderia ser viável. Desse modo, duas confi- 
gurações de produto foram também desenvolvidas para 
representar os produtos existentes. 


Produtos 1 e 2 são os existentes, enquanto o produto 3 
é novo. 


e Produto 1. Um detergente pré-misturado em um for- 
mato de uso manual (50 aplicações por frasco) que seja 
seguro para o ambiente (biodegradável) e ainda atenda 
a todos os padrões sanitários (desinfetante) a apenas 79 
centavos por aplicação. 

e Produto 2. Uma versão industrial do produto 1 com 
as características ambientais e sanitárias, mas em uma 
forma concentrada em grandes embalagens (200 aplica- 
ções) ao preço baixo de 49 centavos por aplicação. 

e Produto 3. Um valor real de detergente em pó em ta- 
manhos econômicos (200 aplicações por frasco) pelo 
menor preço possível de 35 centavos por aplicação. 


Passo 2: Simulação de escolhas 
Uma vez que as configurações de produto foram especi- 
ficadas, elas foram submetidas ao simulador de escolha 


usando os resultados dos 80 respondentes que restaram. 
Neste processo, as utilidades parciais para cada respon- 
dente foram utilizadas para calcular a utilidade esperada 
de cada produto. 


Por exemplo, para o respondente 107 (ver Tabela 
7-11), a utilidade do produto 1 é calculada tomando-se 
as estimativas da utilidade parcial daquele responden- 
te para os níveis de pré-misturado (-0,0556), 50 apli- 
cações por frasco (0,4444), biodegradável (-0,5417), 
desinfetante (-0,2083) e 79 centavos por aplicação 
(-2,3889), mais a constante (4,111) para um valor total 
de utilidade de 1,361. Valores de utilidade para os ou- 
tros dois produtos foram calculados de uma maneira 
parecida. Deve ser observado que utilidades reescalo- 
nadas também podem ser usadas tão facilmente quan- 
to, pois a previsão de preferências de escolha no passo 
seguinte se concentra no tamanho relativo dos valores 
de utilidade. 


Assim, o processo deriva um conjunto de valores de 
utilidade para cada produto único para cada indivíduo. 
Desse modo, a preferência de cada respondente é usa- 
da para simular as escolhas esperadas daquele indivíduo 
quando se defronta com tal escolha de produtos. Os três 
produtos utilizados no simulador de escolhas são mais 
representativos do efeito de impacto diferencial entre 
produtos quando a similaridade entre os mesmos é mi- 
nimizada. 


Passo 3: Cálculo da participação de preferência 

O simulador de escolha então calculou as estimativas de 
preferência para os produtos para cada respondente. Pre- 
visões para as participações de mercado esperadas foram 
feitas com dois modelos de escolha: o modelo de utilidade 
máxima e um modelo probabilístico. O modelo de utilida- 
de máxima conta o número de vezes que cada um dos três 
produtos teve a mais alta utilidade no conjunto de respon- 
dentes. 
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Como visto na Tabela 7-17, o produto 1 foi preferido 
(teve o maior valor de preferência previsto) por apenas 
6,88% dos respondentes. O produto 2 foi o próximo, pre- 
ferido por 21,5%*, e o de maior preferência foi o produto 
3, com 71,88%. Os percentuais fracionários são decor- 
rentes de previsões empatadas entre os produtos 2 e 3. 


Uma segunda abordagem para prever participações 
de mercado é um modelo de probabilidade, como o BTL 
ou o modelo logit. Ambos avaliam a preferência relativa 
de cada produto e estimam a proporção de vezes que um 
respondente ou o conjunto de respondentes irá comprar 
um produto. 


Como exemplo dos cálculos, os resultados agregados 
podem ser usados. Os valores agregados de preferên- 
cia previstos para os produtos são 2,5, 4,9 e 5,9 para os 
produtos 1,2 e 3, respectivamente. As participações de 
mercado previstas dos resultados do modelo agregado 
usando BTL são então calculadas por 


Participação de mercado, q qo1 = 2,5/(2,5 + 4,9 45,9) = 
0,188, ou 18,8% 

Participação de mercado, quo» = 4,9/(2,5 + 4,9 + 5,9) = 
0,368, ou 36,8% 

Participação de mercado, quo 3 = 5,9/(2,5 + 4,9 + 5,9) = 
0,444, ou 44,4% 


Esses resultados são muito próximos àqueles obtidos 
a partir do uso das utilidades individuais de responden- 
tes, como mostrado na Tabela 7-17. 

Resultados análogos são obtidos usando-se o mode- 
lo probabilístico logit e também são exibidos na Tabela 
7-17. Usando o modelo recomendado em situações que 
envolvem escolhas repetitivas (modelos de probabi- 
lidade), como no caso de um detergente industrial, a 
HBAT tem estimativas de participações de mercado 
que indicam uma ordenação do produto 3, produto 2 e, 
finalmente, produto 1. 


Deve ser lembrado que tais resultados representam a 
amostra inteira, e as participações de mercado podem di- 
ferir dentro de segmentos específicos dos respondentes. 


* N. de R. T.: O número correto é 21,25%. 


Resumo 


A análise conjunta enfatiza mais a habilidade do pesqui- 
sador ou do administrador em teorizar sobre o comporta- 
mento de escolha do que o faz em técnica analítica. Como 
tal, ela deve ser vista principalmente como exploratória, 
pois muitos de seus resultados são diretamente atribuíveis 
a suposições básicas feitas durante o curso do delinea- 
mento e da execução do estudo. Este capítulo ajuda você 
a fazer o seguinte: 


Explicar os usos administrativos da análise conjunta. A 
análise conjunta é uma técnica multivariada desenvolvida 
especificamente para entender como respondentes desen- 
volvem preferências por objetos (produtos, serviços ou 
idéias). A flexibilidade da análise conjunta significa que 
ela pode ser usada em praticamente qualquer área na qual 
decisões são estudadas. A análise conjunta assume que 
qualquer conjunto de objetos (p.ex., marcas, companhias) 
ou conceitos (posicionamento, benefícios, imagens) é ava- 
liado como uma coleção de atributos. Tendo determinado 
a contribuição de cada fator para a avaliação geral do con- 
sumidor, o pesquisador pode então (1) definir o objeto ou 
conceito com a combinação ótima de características, (2) 
mostrar as contribuições relativas de cada atributo e cada 
nível à avaliação geral do objeto, (3) usar estimativas de 
comprador ou julgamentos de consumidor para prever 
preferências entre objetos com diferentes conjuntos de 
características, (4) isolar grupos de clientes potenciais que 
colocam importância distinta sobre as características para 
definir segmentos de alto e baixo potencial, e (5) identificar 
oportunidades de marketing pela exploração do potencial 
de mercado para combinações de características que não 
estão correntemente disponíveis. O conhecimento da estru- 
tura de preferência para cada indivíduo permite uma flexi- 
bilidade quase ilimitada para examinar reações individuais 
e agregadas para uma vasta gama de questões relacionadas 
a produtos ou serviços. 


Conhecer as diretrizes para seleção de variáveis a serem 
examinadas pela análise conjunta. A análise conjunta 
emprega uma variável estatística muito parecida em for- 
ma com aquela que vimos em outras técnicas multivaria- 
das. A variável estatística conjunta é uma combinação 
linear de efeitos das variáveis independentes (fatores) 
sobre uma variável dependente. O pesquisador especifi- 
ca as variáveis independentes (fatores) e seus níveis, mas 


TABELA 7-17 Resultados de simulador de escolhas para as formulações de três produtos 


PREVISÕES DE PARTICIPAÇÃO DE MERCADO 


Modelos probabilísticos 


Formulação do produto Modelo de utilidade máxima (%) BTL (%) Logit (%) 
1 6,88 18,00 7,85 
2 21,25 36,58 29,09 
3 71,88 45,42 63,06 
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o respondente apenas fornece informação sobre a medi- 
da dependente. O planejamento dos estímulos envolve 
a especificação da variável estatística conjunta pela sele- 
ção dos fatores e níveis a serem incluídos nos estímulos. 
Quando operacionaliza fatores ou níveis, o pesquisador 
deve garantir que as medidas são comunicáveis e acioná- 
veis. Tendo selecionado os fatores e garantido que as me- 
didas atendem a tais condições, o pesquisador ainda deve 
abordar três questões específicas à definição de fatores: o 
número de fatores a serem incluídos, multicolinearidade 
entre os fatores, e o papel ímpar do preço como fator. 


Formular o plano experimental para uma análise conjun- 
ta. Para a análise conjunta explicar a estrutura de prefe- 
rência de um respondente somente com base em avalia- 
ções gerais de um conjunto de estímulos, o pesquisador 
deve tomar duas decisões-chave com relação ao modelo 
conjunto inerente: a especificação da regra de composição 
a ser usada, e a seleção do tipo de relações entre estima- 
tivas de utilidades parciais. Tais decisões afetam tanto o 
planejamento dos estímulos quanto a análise das avalia- 
ções do respondente. A regra de composição descreve 
como o pesquisador postula que o respondente combina 
as utilidades parciais dos fatores para obter utilidade ge- 
ral. É uma decisão crítica, pois ela define a natureza bási- 
ca da estrutura de preferência que será estimada. A regra 
de composição mais comum é um modelo aditivo. A regra 
de composição usando efeitos de interação é semelhante 
à forma aditiva no sentido de assumir que o cliente soma 
as utilidades parciais para obter um total geral ao longo 
do conjunto de atributos. Ela se diferencia no sentido de 
que permite que certas combinações de níveis sejam mais 
ou menos do que apenas suas somas. A escolha de uma 
regra de composição determina os tipos e quantia de tra- 
tamentos ou estímulos que o respondente deve avaliar, 
junto com a forma do método de estimação usado. Pon- 
derações acompanham o uso de uma abordagem em vez 
de outra. Uma forma aditiva requer menos avaliações do 
respondente e torna mais fácil a obtenção de estimativas 
para as utilidades parciais. No entanto, a forma interativa 
é uma representação mais precisa, pois respondentes utili- 
zam regras de decisão mais complexas na avaliação de um 
produto ou serviço. 


Entender como criar planejamentos fatoriais. Tendo 
especificado os fatores e níveis, mais a forma básica do 
modelo, o pesquisador deve a seguir tomar três decisões 
envolvendo coleta de dados: o tipo de método de apresen- 
tação para os estímulos (troca, perfil completo ou compa- 
ração aos pares), o tipo de variável de resposta e o método 
de coleta de dados. O objetivo prioritário é apresentar as 
combinações de atributos (estímulos) aos respondentes da 
maneira mais realista e eficiente possível. Em uma análise 
conjunta simples com um pequeno número de fatores e 
níveis, o respondente avalia todos os possíveis estímulos, 
naquilo que é conhecido como planejamento fatorial. À 


medida que a quantia de fatores e níveis aumenta, tal deli- 
neamento se torna impraticável. Assim, com o número de 
tarefas de escolha especificado, o que é necessário é um 
método para desenvolver um subconjunto dos estímulos 
totais que ainda fornecem a informação necessária para se 
fazerem estimativas precisas e realistas de utilidades par- 
ciais. O processo de seleção de um subconjunto de todos 
os possíveis estímulos deve ser feito de uma maneira que 
se preserve a ortogonalidade (nenhuma correlação entre 
níveis de um atributo) e equilíbrio (cada nível aparece em 
um fator o mesmo número de vezes) do planejamento. 
Um planejamento fatorial fracionário é o método mais 
comum para definir um subconjunto de estímulos para 
avaliação. O processo desenvolve uma amostra de possí- 
veis estímulos, com o número de estímulos dependendo 
do tipo de regra de composição assumida como sendo 
usada pelos respondentes. Se a quantia de fatores se torna 
muito grande e a análise conjunta adaptativa não é aceitá- 
vel, pode ser empregado um planejamento de ligação no 
qual os fatores são divididos em subconjuntos de tamanho 
adequado, com alguns atributos se sobrepondo entre os 
conjuntos, de forma que cada conjunto tem um fator em 
comum com outros conjuntos de fatores. Os estímulos são 
então construídos para cada subconjunto de maneira que 
os respondentes jamais vêem o número original de fatores 
em um único perfil. 


Explicar o impacto da escolha entre ordenação e avaliação 
como medida de preferência. A medida de preferência — 
ordenação versus avaliação (p.ex., uma escala de 1 a 10) — 
também deve ser escolhida. Apesar de o método de troca 
empregar apenas dados de ordenação, tanto o método de 
comparação aos pares quanto o de perfil completo podem 
avaliar preferências via obtenção de uma avaliação de 
preferência de um estímulo sobre o outro ou apenas uma 
medida binária. Uma medida de preferência de ordena- 
ção é provavelmente mais confiável, pois é mais fácil do 
que avaliação com um número razoavelmente pequeno 
(20 ou menos) de estímulos, e fornece maior flexibilidade 
na estimação de diferentes tipos de regras de composição. 
Em contraste, escalas de avaliação são facilmente analisa- 
das e administradas, até mesmo pelo correio. No entanto, 
os respondentes podem ser menos discriminatórios em 
seus julgamentos do que em processos de ordenação. A 
decisão sobre o tipo de medida de preferência a ser usa- 
da deve ser baseada em aspectos práticos e conceituais. 
Muitos pesquisadores preferem a medida de ordenação 
porque ela representa o processo de escolha inerente à 
análise conjunta — escolher entre objetos. Sob um pon- 
to de vista prático, porém, o esforço de ordenar grandes 
quantias de estímulos se torna exagerado, particularmente 
quando a coleta de dados é feita em um ambiente que não 
entrevista pessoal. A medida de avaliação tem a vantagem 
intrínseca de ser fácil de administrar em qualquer tipo de 
contexto de coleta de dados, apesar de ainda ter desvan- 
tagens. Se os respondentes não estão engajados e envolvi- 
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dos na tarefa de escolha, uma medida de avaliação pode 
fornecer pouca diferenciação entre perfis (p.ex., todos os 
perfis avaliados como aproximadamente o mesmo). Além 
disso, à medida que a tarefa de escolha se torna mais com- 
plicada com estímulos adicionais, o pesquisador deve se 
preocupar não apenas com o cansaço, mas também com a 
confiabilidade das avaliações ao longo dos estímulos. 


Avaliar a importância relativa das variáveis preditoras 
e de cada um de seus níveis nos julgamentos do cliente. 
O método mais comum de interpretação é um exame das 
estimativas das utilidades parciais para cada fator a fim 
de determinar a magnitude e o padrão das mesmas. Es- 
timativas de utilidade parcial são tipicamente escalona- 
das de forma que quanto maior a utilidade parcial (seja 
positiva ou negativa), maior o impacto da mesma sobre 
a utilidade geral. Além de retratar o impacto de cada ní- 
vel com as estimativas de utilidade parcial, a análise con- 
junta pode avaliar a importância relativa de cada fator. 
Como estimativas de utilidade parcial são tipicamente 
convertidas a uma escala comum, a maior contribuição à 
utilidade geral — e, portanto, o fator mais importante — é 
o fator com o maior intervalo (da menor à maior) de uti- 
lidades parciais. Os valores de importância de cada fator 
podem ser convertidos a percentuais que somam 100% 
dividindo-se o intervalo de cada fator pela soma de todos 
os valores de amplitudes. Ao avaliar qualquer conjunto 
de estimativas de utilidades parciais, o pesquisador deve 
considerar tanto a relevância prática quanto as relações 
teóricas entre níveis. Em termos de relevância prática, a 
principal consideração é o grau de diferenciação entre 
utilidades parciais dentro de cada atributo. Muitas vezes, 
um atributo tem uma estrutura teórica para as relações 
entre níveis. A mais comum é a relação monotônica, tal 
que as utilidades parciais do nível C devem ser maiores 
do que aquelas do nível B, que, por sua vez, devem ser 
maiores do que as utilidades parciais do nível A. Surge 
um problema quando as utilidades parciais não seguem 
o padrão teorizado e violam a relação monotônica assu- 
mida, provocando aquilo que costuma ser chamado de 
inversão. Inversões podem causar sérias distorções na 
representação de uma estrutura de preferência. 


Aplicar um simulador de escolhas para resultados con- 
juntos para a previsão de julgamentos do cliente de no- 
vas combinações de atributos. Descobertas conjuntas 
revelam a importância relativa dos atributos e o impac- 
to de níveis específicos sobre estruturas de preferência. 
Outro objetivo prioritário da análise conjunta é conduzir 
análises do tipo “e se...” para prever a participação de 
preferências que um estímulo (real ou hipotético) pode 
captar em vários cenários competitivos de interesse à ad- 
ministração. Simuladores de escolha permitem ao pes- 
quisador simular qualquer número de cenários competi- 
tivos e então estimar como os respondentes reagiriam a 
cada cenário. O seu real benefício, no entanto, envolve 


a habilidade do pesquisador em especificar condições 
ou relações entre os estímulos para representar mais 
realisticamente condições de mercado. Por exemplo, to- 
dos os objetos competirão igualmente com os demais? 
A similaridade entre os objetos cria diferentes padrões 
de preferência? Podem ser incluídas na simulação as ca- 
racterísticas não medidas do mercado? Quando se usa 
um simulador de escolhas, pelo menos três tipos básicos 
de efeitos devem ser incluídos: (1) impacto diferencial 
— O impacto de qualquer atributo/nível é mais importan- 
te quando o respondente valora aquele objeto entre os 
dois mais relevantes, indicando seu papel na escolha real 
entre esses objetos; (2) substituição diferencial — a simi- 
laridade entre objetos afeta a escolha, com objetos pare- 
cidos compartilhando preferência geral (p.ex., quando se 
escolhe entre pegar um ônibus ou dirigir um carro, acres- 
centar ônibus de cores diferentes não aumentará a chan- 
ce de se pegar um ônibus, mas os dois objetos dividiram 
a chance geral de pegar um ônibus); e (3) melhoramento 
diferencial — dois objetos muito parecidos do mesmo tipo 
básico podem ser distinguidos por pequenas diferenças 
em um atributo que é relativamente irrelevante quando 
se comparam dois objetos de tipos diferentes. O passo fi- 
nal na simulação conjunta é prever preferência para cada 
indivíduo e então calcular a participação de preferências 
para cada estímulo agregando-se as escolhas individuais. 


Comparar um modelo de efeitos principais e um mode- 
lo com termos de interação e mostrar como se avalia a 
validade de um modelo versus o outro. Um benefício 
chave da análise conjunta é a habilidade de representar 
muitos tipos de relações na variável estatística conjun- 
ta. Uma consideração crucial é o tipo de efeitos (efeitos 
principais somados com quaisquer termos de interação 
desejados) que devem ser incluídos, pois eles demandam 
modificações no planejamento de pesquisa. O emprego 
de termos de interação adiciona generalidade à regra de 
composição. A adição de termos de interação apresen- 
ta certas desvantagens: (1) cada termo de interação re- 
quer uma estimativa adicional de utilidade parcial com 
pelo menos um estímulo extra para cada respondente 
avaliar. A menos que o pesquisador saiba exatamente 
quais termos de interação estimar, o número de estímu- 
los cresce dramaticamente. Além disso, se respondentes 
não usam um modelo interativo, a estimação de termos 
de interação adicionais na variável estatística conjunta 
reduz a eficiência estatística (mais estimativas de utili- 
dades parciais) do processo de estimação e ainda torna 
a tarefa conjunta mais árdua. (2) Mesmo quando usadas 
por respondentes, interações prevêem substancialmente 
menos variância do que efeitos aditivos, geralmente não 
excedendo um aumento de 5 a 10% na variância explica- 
da. Assim, em muitos casos, o poder preditivo aumenta- 
do será mínimo. (3) Termos de interação são frequente- 
mente substanciais em casos para os quais atributos são 


CAPÍTULO7 Análise Conjunta 419 


menos tangíveis, particularmente quando reações esté- 
ticas ou emocionais executam um papel importante. O 
potencial para explicação ampliada a partir de termos de 
interação deve ser equilibrado com as consegiiências ne- 
gativas do acréscimo dos mesmos. O termo de interação 
é mais efetivo quando o pesquisador pode teorizar que 
porções não-explicadas de utilidade são associadas com 
apenas certos níveis de um atributo. 


Reconhecer as limitações da análise conjunta tradicional 
e selecionar a metodologia alternativa adequada (p.ex., 
análise conjunta baseada em escolhas ou adaptativa) 
quando necessário. Os métodos de perfil completo ou 
de troca não são gerenciáveis com mais de 10 atributos, 
entretanto muitos estudos conjuntos precisam incorpo- 
rar 20, 30 ou mesmo mais atributos. Nestes casos, alguma 
forma adaptada ou reduzida de análise conjunta é usa- 
da para simplificar o esforço de coleta de dados e ainda 
representar uma decisão realista de escolha. As duas 
opções incluem (1) uma análise conjunta adaptativa/au- 
to-explicada para lidar com um grande número de atribu- 
tos, e (2) uma análise conjunta baseada em escolhas para 
fornecer tarefas de escolha mais realistas. No modelo 
auto-explicado, o respondente fornece uma avaliação do 
quão desejável é cada nível de um atributo e então valora 
a importância relativa do atributo como um todo. Com o 
modelo adaptativo (híbrido), os modelos conjuntos auto- 
explicado e de utilidade parcial são combinados. Os valo- 
res auto-explicados são utilizados para criar um pequeno 
subconjunto de estímulos selecionados a partir de um 
planejamento fatorial fracionário. Os estímulos são então 
avaliados de uma maneira semelhante à análise conjunta 
tradicional. Os conjuntos de estímulos diferem entre res- 
pondentes, e, apesar de cada respondente avaliar somen- 
te um pequeno número, coletivamente todos os estímu- 
los são avaliados por uma parte dos respondentes. Para 
tornar a tarefa conjunta mais realista, uma metodologia 
conjunta alternativa, conhecida como conjunta baseada 
em escolhas, pode ser usada. Pede-se ao respondente que 
ele escolha um estímulo de perfil completo a partir de um 
conjunto de estímulos alternativos conhecido como con- 
junto escolha. Este processo é muito mais representativo 
do processo real de seleção de um produto a partir de um 
conjunto de produtos competitivos. Além disso, a análise 
conjunta baseada em escolhas oferece uma opção de não 
escolher qualquer um dos estímulos apresentados pela 
inclusão de uma opção do tipo “Nenhuma das alterna- 
tivas” no conjunto escolha. Apesar de análise conjunta 
tradicional assumir que as preferências dos respondentes 
sempre serão alocadas no conjunto de estímulos, a abor- 
dagem baseada em escolhas permite a contração do mer- 
cado se todas as alternativas em um conjunto escolha são 
não-atraentes. 

Para usar análise conjunta, o pesquisador deve avaliar 
muitas facetas do processo de tomada de decisões. Nosso 
foco tem sido o fornecimento de uma melhor compreen- 


são dos princípios da análise conjunta e de como eles 
representam o processo de escolha do consumidor. Esta 
compreensão deve permitir que pesquisadores evitem a 
má aplicação desta técnica relativamente nova e poderosa 
sempre que estiver diante da necessidade de entender jul- 
gamentos de escolha e estruturas de preferência. 


Questões 


1. Peça a três colegas de classe para avaliarem combinações de 
escolhas com base nessas variáveis e níveis relativos ao seu 
estilo de livro-texto preferido para uma aula e especifique a 
regra de composição que você imagina que eles emprega- 
rão. Colete informações com os métodos de troca e de perfil 
completo. 


Fator Nível 


Profundidade Aborda com grande profundidade 


cada assunto. 
Introduz cada assunto em linhas gerais. 


Cada capítulo inclui imagens engraça- 
das. 


Tópicos ilustrativos são apresentados. 
Cada capítulo inclui gráficos para ilus- 
trar as questões numéricas. 
Referências gerais são incluídas no 
final do texto. 


Ilustrações 


Referências 


Cada capítulo inclui referências especí- 
ficas para os tópicos cobertos. 


2. Quão difícil foi para os respondentes lidarem com os con- 
ceitos prolixos e levemente abstratos que eles foram soli- 
citados a avaliar? Como você melhoraria as descrições dos 
fatores ou níveis? Qual método de apresentação foi mais 
fácil para os respondentes? 

3. Usando o procedimento numérico simples discutido ante- 
riormente ou um programa de computador, analise os da- 
dos do experimento na questão 1. 

4. Planeje um experimento de análise conjunta com pelo me- 
nos quatro variáveis e dois níveis de cada variável que seja 
apropriado a uma decisão de marketing. Ao fazer isso, de- 
fina a regra de composição que você usará, o planejamento 
experimental para criar estímulos e o método de análise. 
Use pelo menos cinco respondentes para apoiar sua lógica. 

5. Quais são os limites práticos da análise conjunta em termos 
de variáveis ou tipos de valores para cada variável? Quais ti- 
pos de problemas de escolha são mais adequados ao estudo 
com a análise conjunta? Quais são os menos servidos pela 
análise conjunta? 

6. Como você orientaria um pesquisador de mercado na esco- 
lha entre os três tipos de metodologias conjuntas? Quais são 
as questões mais importantes a considerar, tendo em vista 
as vantagens e desvantagens de cada metodologia? 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustram problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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SEÇÃO 


Técnicas de Interdependência 


VISÃO GERAL 


Os métodos de dependência descritos na Seção Il fornecem 
ao pesquisador diversas técnicas para avaliar relações entre 
uma ou mais variáveis dependentes e um conjunto de variá- 
veis independentes. Foram discutidos muitos métodos que 
acomodam todos os tipos (métricas e não-métricas) e nú- 
meros potencialmente grandes de variáveis dependentes e 
independentes que poderiam ser aplicadas a conjuntos de 
observações. Mas e se as variáveis ou as observações estive- 
rem relacionadas de modos não captados pelas relações de 
dependência? E se estiver faltando a avaliação de interdepen- 
dência (isto é, estrutura)? Uma das habilidades mais básicas 
dos seres humanos é classificar e categorizar objetos e infor- 
mação em esquemas mais simples, de forma que podemos 
caracterizar os objetos dentro de grupos em vez de lidar com 
cada objeto individualmente. O objetivo dos métodos desta 
seção é identificar a estrutura em um conjunto definido de va- 
riáveis, observações ou objetos. A identificação de estrutura 
oferece não apenas simplicidade, mas também um meio de 
descrição e até mesmo de descoberta. 

As técnicas de interdependência, porém, estão concen- 
tradas somente na definição de estrutura, avaliando a inter- 
dependência sem quaisquer relações de dependência asso- 
ciadas. Nenhuma das técnicas de interdependência definirá 
a estrutura para otimizar ou maximizar uma relação de depen- 
dência. É tarefa do pesquisador primeiramente utilizar esses 
métodos na identificação de estrutura e então empregá-la 
onde for apropriado. Os objetivos de relações de dependên- 
cia não são “incorporados” nesses métodos de interdepen- 
dência — eles avaliam a estrutura para seus próprios objetivos 
e nenhum outro. 


CAPÍTULOS NA SEÇÃO III 


A Seção III contém apenas dois capítulos, os quais cobrem 
duas das três técnicas de interdependência. A primeira, aná- 
lise fatorial (Capítulo 3), foi discutida na Seção | como a pre- 


paração para a análise multivariada, pois ela nos fornece uma 
ferramenta para compreender as relações entre variáveis, um 
conhecimento fundamental para todas as nossas análises 
multivariadas. As questões de multicolinearidade e parcimô- 
nia de modelo são reflexos da estrutura subjacente das va- 
riáveis, e a análise fatorial fornece uma maneira objetiva de 
avaliar os agrupamentos de variáveis e a habilidade de incor- 
porar variáveis compostas que refletem esses agrupamentos 
de variáveis em outras técnicas multivariadas. 

Mas não são apenas variáveis que têm estrutura. Apesar 
de assumirmos independência entre as observações e variá- 
veis em nossa estimação de relações, também sabemos que 
a maioria das populações tem subgrupos que compartilham 
características gerais. Comerciantes procuram mercados- 
alvo de grupos diferenciados de consumidores homogêneos, 
estrategistas procuram grupos de empresas semelhantes 
para identificar elementos estratégicos comuns, e criado- 
res de modelos financeiros procuram títulos com princípios 
semelhantes para criar carteiras de ações. Essas e muitas 
outras situações demandam técnicas que identifiquem esses 
grupos de objetos semelhantes com base em um conjunto de 
características. 

Este objetivo é atendido pela análise de agrupamentos, 
o tópico do Capítulo 8. Análise de agrupamentos, em termos 
ideais, é adequada para definir grupos de objetos com má- 
xima homogeneidade dentro dos grupos, enquanto também 
têm máxima heterogeneidade entre os grupos — determinando 
os grupos mais semelhantes que também são os mais distin- 
tos uns dos outros. Como mostramos, a análise de agrupa- 
mentos tem uma rica tradição de aplicação em quase todas 
as áreas de investigação. Mas sua habilidade de definir gru- 
pos de objetos semelhantes é contrastada por sua natureza 
bastante subjetiva e pelo papel instrumental desempenhado 
pelo julgamento do pesquisador em diversas decisões-chave. 
Este aspecto subjetivo não diminui a utilidade da técnica, mas 
coloca uma responsabilidade maior sobre o pesquisador para 
uma completa compreensão do método e do impacto de cer- 
tas decisões sobre a solução final de agrupamentos. 

Mas e se apenas soubermos quão semelhantes são os 
objetos e não tivermos idéia da origem daquela semelhança 
ou de como agrupar melhor os objetos”? Essa situação é dis- 
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cutida no Capítulo 9, “Escalonamento Multidimensional e Aná- 
lise de Correspondência”. Escalonamento multidimensional é 
uma técnica que começa com uma análise univariada — uma 
única medida de similaridade entre objetos — e infere a di- 
mensionalidade das semelhanças entre os objetos. Ela tenta 
responder esta questão básica: os objetos podem ser agru- 
pados em um espaço de uma, duas, três ou n dimensões, de 
forma a representar adequadamente as semelhanças entre 
os objetos por sua proximidade? Como tal, o escalonamento 
multidimensional é uma forma de análise decomposicional, 
um pouco parecida com a análise conjunta (ver Capítulo 7), 
mas nesse caso apenas suas similaridades são conhecidas, 
não as características dos objetos. Uma forma especial de 
escalonamento multidimensional é a análise de correspon- 


dência, a qual analisa uma forma distinta de dados — variáveis 
categóricas com tabulação cruzada. A partir desses dados, 
a análise de correspondência é capaz de retratar as relações 
entre linhas e colunas (p.ex., produtos e atributos) em uma 
perspectiva dimensional na qual a proximidade representa 
semelhança. 

Análise de agrupamentos, análise fatorial e escalona- 
mento multidimensional fornecem ao pesquisador métodos 
que trazem ordem aos dados na forma de estrutura entre as 
observações ou variáveis. Desse modo, o pesquisador pode 
compreender melhor as estruturas básicas dos dados, o que 
não apenas facilita a descrição dos dados, mas também for- 
nece uma fundamentação para uma análise mais refinada das 
relações de dependência. 


CAPÍTULO 


Análise de Agrupamentos 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


Definir análise de agrupamentos, seu papel e suas limitações. 

dentificar as questões de pesquisa abordadas pela análise de agrupamentos. 
Compreender como a similaridade entre objetos é medida. 

Distinguir entre as várias medidas de distância. 

Diferenciar algoritmos de agrupamentos. 

Entender as diferenças entre técnicas hierárquicas e não-hierárquicas de agrupamentos. 
Descrever como selecionar o número de agrupamentos a serem formados. 

Seguir as orientações para validação de agrupamentos. 

Construir perfis para os agrupamentos obtidos e avaliar a significância administrativa. 


Apresentação do capítulo 


Acadêmicos e pesquisadores de mercado frequentemente encontram situações melhor resolvidas pela 
definição de grupos de objetos homogêneos, sejam eles indivíduos, empresas, produtos ou mesmo 
comportamentos. Opções de estratégias baseadas na identificação de grupos dentro da população, 
como segmentação e mercado-alvo, não seriam possíveis sem uma metodologia objetiva. Essa mes- 
ma necessidade é encontrada em outras áreas, indo das ciências físicas (p.ex., criar uma taxonomia 
biológica para a classificação de vários grupos de animais — insetos versus mamíferos versus répteis 
às ciências sociais (p.ex., analisar vários perfis psiquiátricos). Em todos os casos, o pesquisador está 
procurando uma estrutura “natural” entre as observações com base em um perfil multivariado. 

A técnica mais comumente usada para essa finalidade é a análise de agrupamentos. A análise de 
agrupamentos reúne indivíduos ou objetos em grupos tais que os objetos no mesmo grupo são mais 
parecidos uns com os outros do que com os objetos de outros grupos. A idéia é maximizar a homoge- 
neidade de objetos dentro de grupos, ao mesmo tempo em que se maximiza a heterogeneidade entre 
os grupos. Este capítulo explica a natureza e o propósito da análise de agrupamentos e guia o pesqui- 
sador na seleção e uso de várias abordagens para essa técnica. 


— 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 
pontos que merecem destaque, além das referências cruza- 


das nos termos-chave, estão em itálico. 
estão em quadros. 


Exemplos ilustrativos 


Algoritmo da vizinhança mais distante Ver método de ligação 
completa. 

Algoritmo de agrupamento Conjunto de regras ou procedi- 
mentos; é semelhante a uma equação. 

Centróide Média ou valor médio dos objetos contidos no agru- 
pamento em cada variável, seja usado na variável estatística 
de agrupamento ou no processo de validação. 
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Centróide de agrupamento Valor médio dos objetos contidos 
no agrupamento em todas as variáveis na variável estatística 
de agrupamento. 

Critério de agrupamento cúbico (CCC) Uma medida direta de 
heterogeneidade na qual os maiores valores CCC indicam a 
solução de agrupamento final. 

Dendrograma Representação gráfica (gráfico em árvore) dos 
resultados de um procedimento hierárquico no qual cada 
objeto é colocado em um eixo e o outro eixo representa os 
passos no procedimento hierárquico. Começando com cada 
objeto representado como um agrupamento separado, o den- 
drograma mostra graficamente como os agrupamentos são 
combinados em cada passo do procedimento até que todos 
estejam contidos em um único agrupamento. 

Diagrama de perfil Representação gráfica dos dados que aju- 
da a projetar observações atípicas ou a interpretar a solução 
final de agrupamento. Normalmente, as variáveis da variável 
estatística de agrupamento ou aquelas usadas para a valida- 
ção são listadas ao longo do eixo horizontal e a escala é o 
eixo vertical. Linhas separadas representam os escores (origi- 
nais ou padronizados) para objetos individuais ou centróides 
de agrupamentos em um plano gráfico. 

Diagrama vertical Representação gráfica de agrupamentos. 
Os objetos separados são mostrados horizontalmente ao 
longo do topo do diagrama, e o processo de agrupamento 
hierárquico é representado verticalmente em combinações de 
agrupamentos. Esse diagrama é semelhante a um dendrogra- 
ma invertido e auxilia na determinação do número apropriado 
de agrupamentos na solução. 

Distância city-block Método de calcular distâncias com base 
na soma das diferenças absolutas das coordenadas para os 
objetos. Esse método assume que as variáveis na variável es- 
tatística de agrupamento não são correlacionadas e que as 
escalas das unidades são compatíveis. 

Distância de Chebychev Medida de distância definida como 
a maior diferença ao longo de todas as variáveis na variável 
estatística de agrupamento. Suscetível a diferenças de esca- 
la; logo, essa medida sempre deve ser usada com variáveis 
padronizadas. 

Distância de Mahalanobis (D?) Forma padronizada de distân- 
cia euclidiana. Resposta de escalonamento em termos de 
desvios-padrão que padroniza os dados, com ajustes feitos 
para correlações entre as variáveis. 

Distância de Manhattan Ver distância city-block. 

Distância euclidiana Medida mais comumente usada da simila- 
ridade entre dois objetos. Essencialmente, é uma medida do 
comprimento de um segmento de reta desenhado entre dois 
objetos, quando representados graficamente. 

Distância euclidiana absoluta Ver distância euclidiana qua- 
drada. 

Distância euclidiana quadrada Medida de similaridade que 
representa a soma das distâncias quadradas sem calcular 
a raiz quadrada (como se faz para calcular distância eucli- 
diana). 

Efeito de estilo resposta Série de respostas sistemáticas de 
um respondente que refletem um viés ou padrão consistente. 


Exemplos incluem responder de que um objeto sempre de- 
sempenha bem ou mal, ao longo de todos os atributos, com 
pouca ou nenhuma variação. 

Função distância normalizada Processo que computa medi- 
das de distância com base em escores de dados originais 
que foram padronizados com uma média de O e um desvio- 
padrão de 1, para remover o viés introduzido por diferenças 
em escalas de diversas variáveis. 

Grupo de entropia Grupo de objetos independentes de qual- 
quer agrupamento (ou seja, eles não se ajustam a agrupa- 
mento nenhum) que podem ser considerados atípicos e pos- 
sivelmente eliminados da análise de agrupamentos. 

Heterogeneidade Uma medida de diversidade de todas as ob- 
servações ao longo dos agrupamentos que é usada como um 
elemento geral em regras de parada. Um grande aumento na 
heterogeneidade quando dois agrupamentos são combina- 
dos indica que existe uma estrutura mais natural quando os 
dois agrupamentos são separados. 

Ligação média Algoritmo de agrupamento hierárquico que re- 
presenta a similaridade como a distância média entre todos 
os objetos em um agrupamento e todos os objetos de outro. 
Essa técnica tende a combinar agrupamentos com pequenas 
variâncias. 

Método centróide Algoritmo de agrupamento hierárquico no 
qual a similaridade entre agrupamentos é medida como a dis- 
tância entre centróides de agrupamentos. Quando dois agru- 
pamentos são combinados, um novo centróide é computado. 
Logo, os centróides de agrupamentos migram, ou se movem, 
conforme os agrupamentos são combinados. 

Método da referência paralela Procedimento de agrupamento 
não-hierárquico que seleciona as sementes de agrupamentos 
simultaneamente no início. Objetos dentro das distâncias de 
referência são designados para a semente mais próxima. Dis- 
tâncias de referência podem ser ajustadas para incluir menos 
ou mais objetos nos agrupamentos. Esse método é o oposto 
do método da referência segúencial. 

Método da referência sequencial Procedimento de agrupa- 
mento não-hierárquico que começa pela seleção de uma 
semente de agrupamento. Todos os objetos dentro de uma 
distância pré-especificada são então incluídos no agrupa- 
mento. Sementes de agrupamentos subsequentes são sele- 
cionadas até que todos os objetos estejam reunidos em um 
agrupamento. 

Método da vizinhança mais próxima Ver método da ligação 
individual. 

Método de ligação completa Algoritmo de agrupamento hierár- 
quico no qual similaridade entre objetos se baseia na distân- 
cia máxima entre objetos em dois agrupamentos (a distância 
entre os membros mais distintos de cada agrupamento). Em 
cada estágio da aglomeração, os dois agrupamentos com a 
menor distância máxima (mais parecidos) são combinados. 

Método de ligação individual Algoritmo de agrupamento hie- 
rárgquico no qual a similaridade é definida como a distância 
mínima entre qualquer objeto em um agrupamento e qual- 
quer objeto de outro, o que simplesmente significa a distância 
entre os objetos mais próximos de dois agrupamentos. Esse 
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procedimento tem o potencial de criar agrupamentos menos 
compactos ou mesmo em cadeia. É diferente do método de 
ligação completa, que usa a distância máxima entre objetos 
no agrupamento. 

Método de Ward Procedimento de agrupamento hierárquico no 
qual a similaridade usada para juntar agrupamentos é calcu- 
lada como a soma de quadrados entre os dois agrupamentos 
somados sobre todas as variáveis. Esse método tende a resul- 
tar em agrupamentos de tamanhos aproximadamente iguais 
devido à sua minimização de variação interna. 

Método divisivo Procedimento de agrupamento hierárquico 
que começa com todos os objetos em um único agrupa- 
mento, que é então dividido em cada passo em dois agru- 
pamentos adicionais que contêm os objetos mais distintos. 
O agrupamento único é dividido em dois, e em seguida um 
desses dois é dividido, formando um total de três agrupamen- 
tos. Isso continua até que todas as observações estejam em 
agrupamentos unitários. Esse método é o oposto do método 
aglomerativo. 

Método do diâmetro Ver método de ligação completa. 

Métodos aglomerativos Procedimento hierárquico que começa 
com cada objeto ou observação em um grupo separado. Em 
cada passo que se segue, os dois agrupamentos mais pare- 
cidos são combinados para construir um novo agrupamento 
agregado. O processo é repetido até que todos os objetos se- 
jam finalmente combinados em um único agrupamento. Este 
processo é o oposto do método divisivo. 

Multicolinearidade Grau em que uma variável pode ser expli- 
cada pelas outras variáveis na análise. Quando a multicoline- 
aridade aumenta, ela complica a interpretação da variável es- 
tatística de agrupamento por ser mais difícil de determinar o 
efeito de qualquer variável individual devido às inter-relações 
das variáveis. 

Objeto Pessoa, produto ou serviço, empresa ou qualquer outra 
entidade que possa ser avaliada em uma quantia de atributos. 

Padronização centrada em linha Ver padronização dentro de 
casos. 

Padronização interna Método de padronização no qual as res- 
postas de um respondente não são comparadas com a amos- 
tra geral, mas, em vez disso, são comparadas com suas pró- 
prias respostas. Neste processo, também conhecido como 
ipsitizing, as respostas médias dos respondentes são usadas 
para padronizar suas próprias respostas. 

Procedimento de otimização Procedimento de agrupamento 
não-hierárquico que permite a re-designação de objetos do 
agrupamento originalmente designado para um outro agrupa- 
mento com base em um critério de otimização geral. 

Procedimentos hierárquicos Procedimentos de agrupamen- 
tos stepwise que envolvem uma combinação (ou divisão) 
dos objetos em agrupamentos. Os dois procedimentos alter- 
nativos são os métodos aglomerativo e divisivo. O resultado 
é a construção de uma hierarquia, ou estrutura em árvore 
(dendrograma), que representa a formação dos agrupamen- 
tos. Tal procedimento produz N — 1 soluções de agrupa- 
mento, onde N é o número de objetos. Por exemplo, se o 
procedimento aglomerativo começar com cinco objetos em 


grupos separados, ele mostrará como quatro agrupamentos, 
e em seguida três, dois e finalmente um agrupamento, são 
formados. 


Procedimentos não-hierárquicos Procedimentos que produ- 


zem apenas uma solução de agrupamento para um conjunto 
de sementes de agrupamentos. Em vez de usar o processo 
de construção em forma de árvore encontrado nos proce- 
dimentos hierárquicos, as sementes de agrupamentos são 
empregadas para reunir objetos dentro de uma distância 
pré-especificada das sementes. Por exemplo, se quatro se- 
mentes de agrupamentos são especificadas, apenas quatro 
agrupamentos são formados. Os procedimentos não-hierár- 
quicos não produzem resultados para todos os possíveis nú- 
meros de agrupamentos, como é feito com um procedimento 
hierárquico. 


Raiz do desvio padrão quadrático médio (RMSSTD) A raiz 


quadrada da variância do novo agrupamento formado pela 
união de dois agrupamentos ao longo da variável estatística 
de agrupamento. Grandes aumentos indicam que os dois 
agrupamentos representam uma estrutura mais natural de da- 
dos do que quando unidos. 


Regra de parada Algoritmo para determinar o número final de 


agrupamentos a serem formados. Sem qualquer regra de pa- 
rada inerente à análise de agrupamentos, os pesquisadores 
desenvolveram diversos critérios e orientações para essa de- 
terminação. Existem duas classes de regras que são aplica- 
das post hoc e calculadas pelo pesquisador: (1) medidas de 
similaridade e (2) medidas estatísticas adaptadas. 


Semente de agrupamento Centróide inicial ou ponto de par- 


tida para um agrupamento. Esses valores são selecionados 
para iniciar procedimentos de agrupamento não-hierárquico, 
nos quais os agrupamentos são construídos em torno desses 
pontos pré-especificados. 


Similaridade Ver similaridade entre objetos. 
Similaridade entre objetos A correspondência ou associação 


de dois objetos baseada nas variáveis da variável estatísti- 
ca de agrupamento. A similaridade pode ser medida de duas 
formas. Primeiro, é uma medida de associação, com coefi- 
cientes de correlação positivos maiores representando maior 
similaridade. Segundo, a proximidade entre cada par de obje- 
tos pode avaliar a similaridade, onde medidas de distância ou 
de diferença são empregadas, com as menores distâncias ou 
diferenças representando maior similaridade. 


Solução de agrupamento Um número específico de agrupa- 


mentos selecionados como representativos da estrutura de 
dados da amostra de objetos. 


Taxonomia Classificação empiricamente obtida de objetos 


reais baseada em uma ou mais características, como tipifi- 
cada pela aplicação de análise de agrupamentos ou outros 
procedimentos de agregação. Essa classificação pode ser 
contrastada com uma tipologia. 


Tipologia Classificação conceitual de objetos baseada em uma 


ou mais características. Uma tipologia geralmente não tenta 
agregar observações reais, mas, em vez disso, fornece a fun- 
damentação teórica para a criação de uma taxonomia, a qual 
agrega observações reais. 
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Validade de critério Habilidade de agrupamentos em mostrar 
as diferenças esperadas em uma variável não usada para 
formar os agrupamentos. Por exemplo, se os agrupamentos 
foram formados sobre avaliações de desempenho, o analista 
pode antecipar que os agrupamentos com avaliações mais 
altas de desempenho também teriam maiores escores de sa- 
tisfação. Se essa relação ocorrer em teste empírico, então a 
validade de critério está embasada. 

Validade preditiva Ver validade de critério. 

Variável estatística de agrupamento Conjunto de variáveis ou 
características que representam os objetos a serem agrupa- 
dos. É usado para calcular a similaridade entre objetos. 


O QUE É ANÁLISE DE 
AGRUPAMENTOS? 


Análise de agrupamentos é um grupo de técnicas multi- 
variadas cuja finalidade principal é agregar objetos com 
base nas características que eles possuem. Ela tem sido 
chamada de análise Q, construção de tipologia, análise de 
classificação e taxonomia numérica. Essa variedade de no- 
mes se deve ao uso de métodos de agrupamento nas mais 
diversas áreas, como psicologia, biologia, sociologia, eco- 
nomia, engenharia e administração. Apesar de os nomes 
diferirem nas disciplinas, os métodos têm uma dimensão 
em comum: classificação de acordo com relações entre os 
objetos sendo agrupados [1, 2, 4, 10, 22, 27]. Essa dimen- 
são comum representa a essência de todas as abordagens 
de agrupamento — a classificação de dados, como sugerido 
pelos agregados naturais dos dados em si. A análise de 
agrupamentos se assemelha à análise fatorial (ver Capítu- 
lo 3) em seu objetivo de avaliar estrutura. Porém, diferem 
no sentido de que a primeira agrega objetos e a segunda 
está prioritariamente interessada em agregar variáveis. 
Além disso, a análise fatorial faz os agrupamentos com 
base em padrões de variação (correlação) nos dados, en- 
quanto a análise de agrupamentos faz agregados baseados 
em distância (proximidade). 


Análise de agrupamentos como 
uma técnica multivariada 


A análise de agrupamentos classifica objetos (p.ex., res- 
pondentes, produtos ou outras entidades) de modo que 
cada objeto é semelhante aos outros no agrupamento com 
base em um conjunto de características escolhidas. Os 
agrupamentos resultantes de objetos devem então exibir 
elevada homogeneidade interna (dentro dos agrupamen- 
tos) e elevada heterogeneidade externa (entre agrupa- 
mentos). Assim, se a classificação for bem sucedida, os ob- 
jetos dentro dos agrupamentos estarão próximos quando 
representados graficamente, e diferentes agrupamentos 
estarão distantes. 

Em análise de agrupamentos, o conceito da variável 
estatística é novamente uma questão central. A variável 


estatística de agrupamento é o conjunto de variáveis que 
representam as características usadas para comparar 
objetos na análise de agrupamentos. Como a variável 
estatística de agrupamentos inclui apenas as variáveis 
usadas para comparar objetos, ela determina o caráter 
dos objetos. 

A variável estatística em análise de agrupamentos é 
determinada de maneira muito diferente do que ocorre 
em outras técnicas multivariadas. A análise de agrupa- 
mentos é a única técnica multivariada que não estima a 
variável estatística empiricamente, mas, em vez disso, usa 
a variável estatística como especificada pelo pesquisador. 
O foco da análise de agrupamentos é a comparação de 
objetos com base na variável estatística, não na estimação 
da variável estatística em si. Isso torna a definição da va- 
riável estatística feita pelo pesquisador um passo crítico 
na análise. 


Desenvolvimento conceitual com 
análise de agrupamentos 


A análise de agrupamentos tem sido usada em todo tipo 
de pesquisa imaginável. Variando da obtenção de taxo- 
nomias em biologia para agregar todos os organismos 
vivos, de classificações psicológicas baseadas em traços 
de personalidade e outros, à análise de segmentação de 
mercados, a análise de agrupamentos sempre teve uma 
forte tradição de agrupar indivíduos. Essa tradição foi es- 
tendida para classificar objetos, incluindo a estrutura de 
mercado, a análise das semelhanças e diferenças entre no- 
vos produtos, e avaliações de desempenho de empresas 
para identificar agrupamentos com base nas estratégias ou 
orientações estratégicas de empresas. 

Em muitos casos, porém, o agrupamento de objetos é, 
na verdade, um meio para um fim em termos de uma meta 
conceitualmente definida. Os papéis mais comuns que a 
análise de agrupamentos pode desempenhar em desen- 
volvimento conceitual incluem os seguintes: 


e Redução de dados: Um pesquisador que tenha coletado da- 
dos por meio de um questionário pode se deparar com um 
grande número de observações que são sem significado a 
não ser que sejam classificadas em grupos com os quais se 
possa lidar. A análise de agrupamentos pode realizar esse 
procedimento de redução de dados objetivamente pela re- 
dução da informação de uma população inteira ou de uma 
amostra para a informação sobre subgrupos específicos e 
menores. 


Por exemplo, se podemos entender as atitudes de uma 
população pela identificação dos principais grupos den- 
tro da população, então reduzimos os dados para a po- 
pulação inteira em perfis de vários grupos. Dessa ma- 
neira, o pesquisador tem uma descrição mais concisa e 
compreensível das observações, com perda mínima de 
informação. 
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e Geração de hipóteses: A análise de agrupamentos também 
é útil quando um pesquisador deseja desenvolver hipóteses 
relativas à natureza dos dados ou examinar hipóteses pre- 
viamente estabelecidas. 


Por exemplo, um pesquisador pode acreditar que as 
atitudes em relação ao consumo de refrigerantes diet 
versus comuns possam ser usadas para separar os consu- 
midores de refrigerantes em segmentos ou grupos lógi- 
cos. A análise de agrupamentos pode classificar os con- 
sumidores de refrigerantes por suas atitudes em relação 
a refrigerantes normais versus diet, e os agrupamentos 
resultantes, se existirem, podem ser caracterizados por 
similaridades e diferenças demográficas. 


A explosão resultante de aplicações da análise de 
agrupamentos em quase todas as áreas de investigação 
cria não apenas uma riqueza de conhecimento no seu uso, 
mas também a necessidade de uma melhor compreensão 
da técnica para minimizar seu mau emprego. 


Necessidade de apoio conceitual 
em análise de agrupamentos 


Junto com os benefícios da análise de agrupamentos vêm 
algumas advertências que devem ser observadas quando 
ela é empregada. Em cada caso, críticas potenciais podem 
ser retrucadas com forte suporte conceitual sobre um con- 
junto de questões que variam da razão do porquê deve 
existir estrutura (agrupamentos) até os tipos de medidas 
que devem ser usadas para caracterizar os objetos. Mes- 
mo quando a análise de agrupamentos está sendo usada 
em desenvolvimento conceitual, como mencionado, al- 
gum suporte conceitual é essencial. As críticas abaixo são 
as mais comuns que devem ser resolvidas por suporte con- 
ceitual e não empírico: 


e A análise de agrupamentos é descritiva, não-teórica e não-in- 
ferencial. Análise de agrupamentos não tem base estatística 
sobre a qual esboçar inferências de uma amostra para uma 
população, e muitos clamam que é apenas uma técnica explo- 
ratória. Nada garante soluções únicas, já que a pertinência a 
um agrupamento para qualquer número de soluções depen- 
de de muitos elementos do procedimento, e muitas soluções 
diferentes podem ser obtidas pela variação de um ou mais 
elementos. Portanto, se possível, a análise de agrupamentos 
deve ser aplicada a partir de um modo confirmatório, usan- 
do-a para identificar grupos que já têm uma fundamentação 
conceitual estabelecida quanto à existência dos mesmos. 

e A análise de agrupamentos sempre criará agrupamentos, in- 
dependentemente da existência real de alguma estrutura nos 
dados. Quando o pesquisador usa a análise de agrupamen- 
tos, ele está fazendo uma suposição sobre alguma estrutura 
entre os objetos. O pesquisador sempre deve lembrar que 
apenas achar agrupamentos não valida necessariamente a 
existência dos mesmos. Somente com forte suporte concei- 
tual seguido de validação os agrupamentos são potencial- 
mente significantes e relevantes. 


e Asolução de agrupamentos não é generalizável, pois é to- 
talmente dependente das variáveis usadas como base para 
a medida de similaridade. Tal crítica pode ser feita a qual- 
quer técnica estatística, mas a análise de agrupamentos é 
geralmente considerada mais dependente das medidas 
usadas para caracterizar os objetos do que outras técnicas 
multivariadas. Com a variável estatística de agrupamento 
completamente especificada pelo pesquisador, a adição de 
variáveis ilegítimas ou a eliminação de relevantes podem 
ter um substancial impacto sobre a solução resultante. 
Assim, o pesquisador deve tomar muito cuidado com as 
variáveis usadas na análise, garantindo que elas têm forte 
suporte teórico. 


Assim, em qualquer uso da análise de agrupamentos 
o pesquisador deve ter especial cuidado para garantir que 
forte suporte conceitual anteceda a aplicação da técnica. 
Apenas com este suporte em mãos o pesquisador deve en- 
tão tratar cada uma das decisões específicas envolvidas na 
execução da análise de agrupamentos. 


COMO FUNCIONA A ANÁLISE 
DE AGRUPAMENTOS? 


A análise de agrupamentos executa uma tarefa inata 
a todos os indivíduos — reconhecimento de padrões e 
agrupamento. A habilidade humana de processar até 
mesmo pequenas diferenças em inúmeras característi- 
cas é um processo cognitivo inerente aos seres huma- 
nos que não é facilmente igualável com todos os nossos 
avanços tecnológicos. Considere, por exemplo, a tarefa 
de analisar e agrupar rostos humanos. Mesmo a partir 
do nascimento, indivíduos podem rapidamente identi- 
ficar pequenas diferenças em expressões faciais e agru- 
par diferentes rostos em grupos homogêneos enquanto 
se consideram centenas de características faciais. No 
entanto, ainda batalhamos por programas de reconhe- 
cimento de rostos para conseguir realizar a mesma ta- 
refa. O processo de identificação de grupos naturais é 
um que pode se tornar bastante complexo de maneira 
muito rápida. 

Para demonstrar como a análise de agrupamentos 
opera, examinamos um exemplo simples que ilustra al- 
gumas das questões-chave: medir similaridade, formar 
agrupamentos e decidir sobre o número de agrupamen- 
tos que melhor representam uma estrutura. Também 
discutimos brevemente o equilíbrio de considerações ob- 
jetivas e subjetivas que devem ser tratadas por qualquer 
pesquisador. 


Um exemplo simples 


A natureza da análise de agrupamentos e as decisões bá- 
sicas por parte do pesquisador são ilustradas por um sim- 
ples exemplo envolvendo a identificação de segmentos de 
clientes em um cenário de varejo. 
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Suponha que um pesquisador de marketing queira de- 
terminar segmentos de mercado em uma comunidade 
com base em padrões de lealdade a marcas e lojas. Uma 
pequena amostra de sete respondentes é selecionada 
como um teste piloto de como a análise de agrupamen- 
tos é aplicada. Duas medidas de lealdade — V, (lealdade 
à loja) e V, (lealdade à marca) — foram feitas para cada 
respondente em uma escala de O a 10. Os valores para 
cada um dos sete respondentes são mostrados na Figura 
8-1, juntamente com um diagrama de dispersão que re- 
presenta cada observação sobre as duas variáveis. 


O objetivo principal da análise de agrupamentos é de- 
finir a estrutura dos dados colocando as observações mais 
parecidas em grupos. Para conseguir isso, devemos tratar 
de três questões básicas: 


1. Como medimos a similaridade? Necessitamos de um mé- 
todo de comparação simultânea de observações sobre as 


duas variáveis de agrupamentos (V, e V,). Diversos méto- 
dos são possíveis, incluindo a correlação entre objetos ou 
talvez uma medida de sua proximidade em um espaço bi- 
dimensional tal que a distância entre observações indique 
similaridade. 

Como formamos os agrupamentos? Não importa como a si- 
milaridade é medida, o procedimento deve agregar aquelas 
observações que são mais similares em um agrupamento. 
Esse procedimento deve determinar a pertinência a grupo 
de cada observação para cada conjunto de agrupamentos 
formados. 

Quantos grupos formamos? A tarefa final é selecionar um 
conjunto de agrupamentos como a solução final. Fazendo 
isso, o pesquisador se depara com uma ponderação a ser 
feita: menos agrupamentos e menos homogeneidade dentro 
dos agregados versus um grande número de agrupamentos 
e maior homogeneidade interna. A estrutura simples, com 
vistas a parcimônia, é refletida internamente com o menor 
número de agrupamentos possível. No entanto, quando o 
número de agrupamentos diminui, a heterogeneidade den- 
tro dos grupos necessariamente aumenta. Assim, deve ha- 


Valores dos dados 


Variável de Respondentes 
agrupamento A B C D E = E 
V, 2 
Vo 2 5 7 7 6 E 
Diagrama de dispersão 
10 
9H 
8H 
di o O 
ái (E) 
e e 
di (e) 
3H 
di (1) 
1 
0 | I | | | | ; ] | 
0 1 2 3 4 5 6 7 8 9 10 
V; 


FIGURA 8-1 Valores de dados e diagrama de dispersão das sete observações com base nas duas variáveis de agrupamento (V, e V,). 
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ver um equilíbrio entre definir a estrutura mais básica (me- 
nos agrupamentos) e ainda conseguir o nível necessário de 
similaridade” dentro dos agrupamentos. 


Uma vez que temos os procedimentos para tratar de 
cada questão, podemos executar a análise. Ilustramos os 
princípios inerentes a cada uma dessas questões através 
de nosso exemplo simples. 


Medição de similaridade 

A primeira tarefa é desenvolver alguma medida de simi- 
laridade entre os objetos a serem usados no processo de 
agrupamento. Similaridade representa o grau de corres- 
pondência entre objetos ao longo de todas as característi- 
cas usadas na análise. 


Similaridade deve ser determinada entre cada uma das 
sete observações (respondentes A-G) para permitir que 
cada observação seja comparada com as demais. Neste 
exemplo, similaridade será medida de acordo com a dis- 
tância euclidiana (em linha reta) em cada par de observa- 
ções (ver Tabela 8-1) com base nas duas características (V, 
e V,). Neste caso bidimensional (onde cada característica 
forma um eixo do gráfico) podemos perceber distância 
como a proximidade de cada ponto em relação aos outros. 
Ao usar a distância como medida de proximidade, deve- 
mos lembrar que distâncias menores indicam maior simi- 
laridade, de modo que as observações E e F são as mais 
parecidas (1,414) e A e F são as mais distintas (6,403). 


Formação de agrupamentos 

Com medidas de similaridade já calculadas, agora vamos 
para a formação de agrupamentos com base na medida de 
similaridade de cada observação**. Geralmente formamos 
um número de soluções de agrupamentos (uma solução de 
dois agrupamentos, três etc.). Uma vez que os agrupamen- 
tos são formados, escolhemos então a solução final a par- 
tir do conjunto de soluções possíveis. Primeiro discutimos 
como os agrupamentos são formados e, em seguida, exa- 
minamos o processo para seleção de uma solução final. 


*N. de R.T.: A frase correta seria “nível aceitável de heterogeneida- 
de dentro dos agrupamentos”. 
** N. de R. T.: A frase correta seria “... de cada par de observações”. 


Tendo calculado a medida de similaridade, devemos de- 
senvolver um procedimento para formação de agrupa- 
mentos. Como mostrado adiante neste capítulo, muitos 
métodos têm sido propostos, mas para nossos propósitos 
aqui usamos essa regra simples: 


Identifique as duas observações mais semelhantes 
(mais próximas) que ainda não estão no mesmo 
agrupamento e combine seus agrupamentos. 


Aplicamos essa regra repetidamente para gerar vá- 
rias soluções, começando com cada observação em seu 
próprio “agrupamento” e então combinando dois agru- 
pamentos por vez até que todas as observações estejam 
em um único agrupamento. Esse processo é o chamado 
procedimento hierárquico, porque opera no estilo ste- 
pwise para formar um intervalo inteiro de soluções de 
agrupamentos. É também um método aglomerativo, 
porque os agrupamentos são formados pela combinação 
de outros já existentes. 

A Tabela 8-2 detalha os passos do processo aglome- 
rativo hierárquico, primeiramente retratando o estado 
inicial com todas as sete observações em agrupamentos 
unitários, unindo-os em um processo aglomerativo até 
que apenas um agrupamento permaneça. O processo de 
agrupamento em seis passos é descrito aqui: 


Passo 1: Identificar as duas observações mais próximas 
(E e F) e combiná-las em um agrupamento, mu- 
dando de sete para seis agrupamentos. 

Passo 2:Encontrar os próximos pares de observações 
mais semelhantes. Neste caso, três pares têm 
a mesma distância de 2,000 (E-G, C-D e B-C). 
Para nossos propósitos, comecemos com E-G. 
G é um agrupamento unitário, mas E foi com- 
binado no passo anterior com F. Logo, o agru- 
pamento formado nesse estágio agora tem três 
membros: G, E e F. 

Passo 3:Combinar os agrupamentos unitários C e D de 
forma que agora temos quatro agrupamentos 

Passo 4:Combinar B com o agrupamento de dois mem- 
bros C-D que foi formado no passo 3. Neste 
ponto, temos agora três agrupamentos: agrupa- 


(Continua) 


TABELA 8-1 Matriz de proximidade de distâncias euclidianas entre observações 


Observação 
Observação A B Cc D E F G 
A — 
B 3,162 — 
Cc 5,099 2,000 = 
D 5,099 2,828 2,000 = 
E 5,000 2,236 2,236 4,123 — 
F 6,403 3,606 3,000 5,000 1,414 = 
G 3,606 2,236 3,606 5,000 2,000 3,162 = 
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mento 1 (A), agrupamento 2 (B, Ce D) e agru- 
pamento 3 (E, Fe G). 

Passo 5:Combinar os dois agrupamentos de três mem- 
bros em um único agrupamento de seis. A me- 
nor distância seguinte é 2,236 para três pares de 
observações (E-B, B-G e C-E). Usamos apenas 
uma dessas distâncias, contudo, já que cada par 
de observações contém um membro de cada um 
dos dois agrupamentos existentes (B, C e D ver- 
susE,FeG). 

Passo 6:Combinar a observação A com o agrupamento 
remanescente (seis observações) em um único 
agrupamento a uma distância de 3,162. Você 
notará que distâncias menores ou iguais a 3,162 
não são usadas por estarem entre membros do 
mesmo agrupamento. 


O processo de agrupamento hierárquico pode ser re- 
presentado graficamente de diversas maneiras. A Figura 
8-2 ilustra dois métodos. Primeiro, como o processo é 
hierárquico, o processo de agrupamento pode ser mos- 
trado como uma série de agregados aninhados (ver Fi- 
gura 8-2a). Esse processo, contudo, pode representar a 
proximidade das observações para apenas duas ou três 
variáveis de agrupamento no gráfico de dispersão ou no 
gráfico tridimensional. Uma abordagem mais comum é o 
dendrograma, que representa o processo de agrupamen- 
to em um gráfico tipo árvore. O eixo horizontal retrata o 
coeficiente de aglomeração, neste caso a distância usada 
para unir agrupamentos. Essa abordagem é particular- 
mente útil na identificação de observações atípicas, como 
a observação A. Ela também revela o tamanho relativo 
dos variados agrupamentos, apesar de ficar intratável 
quando o número de observações aumenta. 


Determinação do número de 

agrupamentos na solução final 

Um método hierárquico resulta em diversas soluções de 
agrupamentos — nesse caso, começando com uma solução 
de sete agrupamentos e terminando com um. Qual solução 


TABELA 8-2 Processo de agrupamento hierárquico aglomerativo 


devemos escolher? Sabemos que quando nos afastamos de 
agrupamentos unitários na solução de sete agrupamentos, 
a heterogeneidade aumenta. Portanto, por que não ficar- 
mos com sete agrupamentos, a opção mais homogênea 
possível? O problema é que não definimos nenhuma estru- 
tura com sete agrupamentos. Assim, o pesquisador deve 
verificar cada solução quanto à sua descrição da estrutura 
versus a heterogeneidade dos agrupamentos. Primeiro dis- 
cutimos um método simples para definir heterogeneidade 
de cada solução de agrupamento e então avaliamos as so- 
luções para chegarmos a uma solução final. 


Medição de heterogeneidade. Qualquer medida de he- 
terogeneidade de uma solução de agrupamento deve re- 
presentar a diversidade geral entre observações em todos 
os agrupamentos. Na solução inicial de uma abordagem 
aglomerativa onde todas as observações estão em agru- 
pamentos separados, a heterogeneidade é minimizada. 
À medida que observações são combinadas para forma- 
rem agrupamentos, a heterogeneidade aumenta. Assim, a 
medida de heterogeneidade deve começar com um valor 
nulo e aumentar para mostrar o nível de heterogeneidade 
quando agrupamentos são combinados. 


Neste exemplo, usamos uma medida simples de hetero- 
geneidade: a média de todas as distâncias entre observa- 
ções dentro de agrupamentos (ver Tabela 8-2). Como já 
descrito, a medida deve aumentar quando agrupamentos 
são combinados: 


e Nasolução inicial com sete agrupamentos, nossa 
medida de similaridade geral é O — nenhuma observação 
faz par com outra. 

e Seis agrupamentos: A similaridade geral é a distância 
entre as duas observações (1,414) reunidas no passo 1. 

e Cinco agrupamentos: O passo 2 forma um agrupamento 
de três elementos (E, F e G), de modo que a medida de 
similaridade geral é a média das distâncias entre E e F 
(1,414), Ee G (2,000) e Fe G (3,162), o que nos dá 2,192. 

e Quatro agrupamentos: No próximo passo um novo 


agrupamento de dois membros é formado com uma 
(Continua) 


PROCESSO DE AGLOMERAÇÃO 


SOLUÇÃO DE AGRUPAMENTO 


Distância mínima Medida de similaridade ge- 
entre observações Par de ral (distância média dentro 
Passo não-agrupadas” observações Pertinência a agrupamento Número de agrupamentos do agrupamento) 
Solução inicial (A) (B) (C) (D) (E) (F) (G) 7 0 

1 1,414 E-F (A) (B) (C) (D) (E-F) (G) 6 1,414 

2 2,000 E-G (A) (B) (C) (D) (E-F-G) 5 2,192 

3 2,000 C-D (A) (B) (C-D) (E-F-G) 4 2,144 

4 2,000 B-C (A) (B-C-D) (E-F-G) 3 2,234 

5 2,236 B-E (A) (B-C-D-E-F-G) 2 2,896 

6 3,162 A-B (A-B-C-D-E-F-G) 1 3,420 


“Distância euclidiana entre observações. 


CAPÍTULOS Análise de Agrupamentos 435 


(Continuação) , , monitoramos a medida de heterogeneidade conforme o 

aa de DE faz com que a média geral caia número de agrupamentos diminui, grandes aumentos na 
Igeiramente para . : A: : 

8 P à heterogeneidade indicam que dois agrupamentos um tan- 


e Três, dois e um agrupamento: Os últimos três passos e . is 
: b to dissimilares foram unidos naquele estágio. 
formam novos agrupamentos dessa maneira até que 


seja formada uma solução com um só agrupamento 
(passo 6), no qual a média de todas as distâncias na A partir da Tabela 8-2 podemos perceber que a medida 
matriz de distâncias é 3,420. geral de heterogeneidade aumenta quando combinamos 
agrupamentos até alcançarmos a solução de um agrupa- 
Seleção de uma solução final de agrupamento. Agora, mento. Para escolhermos uma solução final, examina- 
como usamos essa medida geral de similaridade para se- mos as mudanças na medida de ae a : 
ontinua 


lecionar uma solução de agrupamentos? Lembre-se que 
estamos tentando obter a estrutura mais simples possí- 
vel que ainda represente agrupamentos homogêneos. Se * N. de R.T.: A frase correta seria “na medida de heterogeneidade”. 


(a) Agrupamentos aninhados 
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Distância na combinação 


FIGURA 8-2 Descrições gráficas do processo de agrupamento hierárquico. 
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(Continuação) 
identificar grandes aumentos indicativos da fusão de 


agrupamentos distintos: 


e Quando juntamos duas observações no início (passo 
1) e também quando fazemos nosso primeiro agrupa- 
mento de três membros (passo 2), percebemos grandes 
aumentos. 

e Nos dois passos seguintes (3 e 4), a medida geral não 
muda substancialmente, o que indica que estamos 
formando outros agrupamentos essencialmente com a 
mesma heterogeneidade dos agregados já existentes. 

e Quando avançamos para o passo 5, o qual combina os 
dois agrupamentos de três membros, percebemos um 
grande aumento. Isso é indicativo de que reunir esses 
dois agrupamentos resultou em um agregado que é bem 
menos homogêneo. Como resultado, consideraríamos 
a solução do passo 4 com três agrupamentos muito 
melhor do que a encontrada no passo 5 com dois agru- 
pamentos. 

e Também podemos notar que, no passo 6, a medida geral 
novamente aumentou bastante, indicando que quando 
esta observação foi unida no último passo, ela mudou 
substancialmente a homogeneidade do agrupamento. 
Dado o perfil peculiar dessa observação (observação A) 
comparada com as outras, ela poderia ser melhor de- 
signada como elemento do grupo de entropia, aquelas 
observações que são atípicas e independentes dos agru- 
pamentos existentes. 


Logo, quando revemos o intervalo de soluções, aque- 
la de três agrupamentos do passo 4 parece a mais ade- 
quada para uma solução final, com dois agrupamentos 
de mesmo tamanho e a observação atípica isolada. 


Considerações objetivas versus subjetivas 


Como já deve estar claro, a seleção da solução final exi- 
ge muito julgamento do pesquisador e é considerada por 
muitos como muito subjetiva. Ainda que métodos mais 
sofisticados tenham sido desenvolvidos para auxiliar na 
avaliação das soluções de agrupamentos, ainda cabe ao 
pesquisador tomar a decisão final quanto ao número de 
agrupamentos a ser aceito como solução final. Além disso, 
decisões sobre as características a serem usadas, os mé- 
todos de combinação de agrupamentos e mesmo a inter- 
pretação de soluções de agrupamento repousam no jul- 
gamento do pesquisador tanto quanto em qualquer teste 
empírico. 


Mesmo este exemplo simples de apenas duas caracte- 
rísticas e sete observações demonstra a potencial com- 
plexidade na execução da análise de agrupamentos. 
Pesquisadores em ambientes realistas se deparam com 
análises contendo muito mais características com muito 
mais observações. 


Portanto, é imperativo que pesquisadores empreguem 
todo suporte objetivo disponível e que sejam guiados por 


Julgamentos sensatos, especialmente nos estágios de pla- 
nejamento e interpretação. 


Resumo 


O processo de análise de agrupamentos, apesar de quase 
natural em indivíduos acostumados a reconhecer padrões 
e agrupar objetos instintivamente, se torna cada vez mais 
complexo à medida que tentamos reproduzir o processo 
através desta técnica multivariada. O pesquisador se de- 
fronta com várias decisões, muitas subjetivas por nature- 
za, que afetam a solução final. No restante deste capítulo, 
discutimos como o pesquisador pode empregar tais proce- 
dimentos mais sofisticados para lidar com a crescente com- 
plexidade de aplicações no mundo real enquanto ainda 
atende à objetividade necessária em projetos de pesquisa. 


PROCESSO DE DECISÃO EM 
ANALISE DE AGRUPAMENTOS 


A análise de agrupamentos, como as outras técnicas mul- 
tivariadas discutidas anteriormente, pode ser vista a partir 
da abordagem de construção de modelo em seis estágios 
introduzida no Capítulo 1 (ver Figura 8-3 para os estágios 
1-3 e Figura 8-6 para os estágios 4-6). Começando com 
os objetivos da pesquisa, que podem ser exploratórios ou 
confirmatórios, o delineamento de uma análise de agrupa- 
mentos lida com o seguinte: 


e A partição do conjunto de dados para formar agrupamentos 
e a seleção de uma solução 

e Interpretação dos agrupamentos para compreender as 
características de cada agrupamento e desenvolver um 
nome ou rótulo que defina apropriadamente a natureza 
dos mesmos 

e Validação dos resultados da solução final (ou seja, determi- 
nação de sua estabilidade e generalização), com a descrição 
das características de cada agrupamento para explicar como 
eles podem diferir quanto a dimensões relevantes, como as 
demográficas 


As seções a seguir detalham todas essas questões por 
meio do processo de construção de modelo em seis está- 
gios. 


Estágio 1: Objetivos da análise 
de agrupamentos 


O objetivo principal da análise de agrupamentos é divi- 
dir um conjunto de objetos em dois ou mais grupos com 
base na similaridade dos objetos em relação a um conjun- 
to de características especificadas (variável estatística de 
agrupamento). No alcance deste objetivo básico, o pes- 
quisador deve tratar de dois aspectos-chave: as questões 
de pesquisa sob estudo nesta análise e as variáveis usadas 
para caracterizar objetos no processo de agrupamento. 
Discutimos cada aspecto na seção a seguir. 
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Estágio 1 Problema de pesquisa 


Selecionar objetivos: 
Descrição taxonômica 
Simplificação de dados 
Revelação de relações 
Selecionar variáveis de agrupamentos 


Estágio 2 Questões de planejamento de pesquisa 


Observações atípicas podem ser detectadas? 
Os dados devem ser padronizados? 


Selecionar uma medida de similaridade 
os métricos EEE SPP EE SEDE 
As variáveis de agrupamento são métricas 


ou não-métricas? 


— O foco é sobre padrão ou proximidade? 
Dados não-métricos 


Associação de similaridade 
Proximidade: Combinação de coeficientes 
Medidas de similaridade baseadas em distância 


-——— Distância euclidiana 
Distância city-block 
Distância de Mahalanobis 


Padrão: Opções de padronização 
-— Medida de similaridade baseada em correlação Padronização de variáveis 
Coeficiente de correlação Padronização por observação 


Estágio 3 Suposições 


A amostra é representativa da população? 
A multicolinearidade é substancial o suficiente 
para afetar resultados? 


Para 
o estágio 
4 


FIGURA 8-3 Estágios 1-3 do diagrama de decisão da análise de agrupamentos. 


Questões de pesquisa em análise de agrupamentos 1. Descrição taxonômica. O uso mais tradicional da análise 
Ao formar grupos homogêneos, a análise de agrupamen- de agrupamentos tem sido para fins exploratórios e para 


tos pode abordar qualquer combinação de três questões a formação de uma taxonomia — uma classificação de ob- 
básicas de pesquisa: jetos com base empírica. Como descrito anteriormente, 
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a análise de agrupamentos tem sido usada em uma vasta 
gama de aplicações devido à sua habilidade para parti- 
ção. Ela pode também gerar hipóteses relacionadas com 
a estrutura dos objetos. Finalmente, apesar de vista prin- 
cipalmente como uma técnica exploratória, a análise de 
agrupamentos pode ser usada para fins confirmatórios. 
Em tais casos, uma tipologia proposta (classificação com 
base teórica) pode ser comparada com aquela obtida pela 
análise de agrupamentos. 

2. Simplificação de dados. Pela definição de estrutura entre 
as observações, a análise de agrupamentos também desen- 
volve uma perspectiva simplificada agrupando observações 
para análise posterior. Ao contrário da análise fatorial, que 
tenta fornecer dimensões ou estrutura para variáveis (ver 
Capítulo 3), a análise de agrupamentos executa a mesma 
tarefa para as observações. Assim, em vez de ver todas 
as observações como únicas, elas podem ser vistas como 
membros de agrupamentos e definidas por suas caracterís- 
ticas gerais. 

3. Identificação de relação. Com os agrupamentos definidos 
e a estrutura subjacente dos dados representada nos agru- 
pamentos, o pesquisador tem um meio de revelar relações 
entre as observações que tipicamente não é possível com as 
observações individuais. Ainda que análises como a discri- 
minante sejam empregadas para identificar relações empiri- 
camente, ou os grupos sejam sujeitos a métodos mais quali- 
tativos, a estrutura simplificada da análise de agrupamentos 
muitas vezes representa relações ou similaridades e diferen- 
ças não reveladas anteriormente. 


Seleção de variáveis de agrupamento 

Os objetivos da análise de agrupamentos não podem ser 
separados da seleção de variáveis usadas para caracte- 
rizar os objetos a serem agrupados. Seja o objetivo ex- 
ploratório ou confirmatório, o pesquisador efetivamente 
restringe os possíveis resultados pelas variáveis selecio- 
nadas para uso. Os agrupamentos obtidos refletem a es- 
trutura inerente dos dados e são definidos apenas pelas 
variáveis. Assim, a seleção das variáveis a serem incluí- 
das na variável estatística de agrupamento deve ser feita 
em relação a considerações teóricas e conceituais, bem 
como práticas. 


Considerações conceituais. Qualquer aplicação da aná- 
lise de agrupamentos deve ter um argumento segundo o 
qual variáveis são selecionadas. Seja o argumento baseado 
em uma teoria explícita, pesquisa anterior, ou suposição, 
o pesquisador deve perceber a importância de incluir 
apenas aquelas variáveis que (1) caracterizam os objetos 
sendo agregados e (2) se relacionam especificamente aos 
objetivos da análise de agrupamentos. A técnica de aná- 
lise de agrupamentos não tem meios de diferenciar variá- 
veis relevantes de irrelevantes, e determina os grupos de 
objetos mais consistentes, mesmo que distintos, ao longo 
de todas as variáveis. Assim, jamais devem ser incluídas 
variáveis indiscriminadamente. Em vez disso, deve-se 
escolher cuidadosamente as variáveis com o objetivo da 
pesquisa como critério de seleção. 


Por exemplo, com o conjunto de dados HBAT, pode- 
mos selecionar as 13 variáveis de percepção como as va- 
riáveis de agrupamento para a análise. Dessa maneira, 
os agrupamentos representariam segmentos de clientes 
com perfis de percepção da HBAT parecidos. Não obs- 
tante, não incluiríamos as variáveis de resultado (satisfa- 
ção, possibilidade de recompra etc.) na mesma análise, 
pois elas são diferentes das percepções e parecem mais 
adequadas como variáveis de validação. 


Considerações práticas. Em um sentido prático, a aná- 
lise de agrupamentos pode ser dramaticamente afetada 
pela inclusão de apenas uma ou duas variáveis inadequa- 
das ou não-diferenciadas [17]. O pesquisador sempre é 
encorajado a examinar os resultados e eliminar as va- 
riáveis que não são distintas (ou seja, que não diferem 
significantemente) ao longo dos agrupamentos obtidos. 
Esse procedimento permite que as técnicas de agrupa- 
mento definam maximamente agrupamentos com base 
apenas nas variáveis que exibem diferenças ao longo dos 
objetos. 


Resumo. Talvez mais do que com outra técnica multi- 
variada, percebemos o impacto do julgamento do pesqui- 
sador referente à inclusão de variáveis na análise. Com 
outras técnicas multivariadas, o processo de estimação 
desenvolve pesos para cada variável refletindo seu papel 
no processo analítico. A análise de agrupamentos não 
pondera discriminadamente as variáveis no processo de 
agrupamento, tornando criticamente importante que o 


REGRAS PRÁTICAS 8-1 


Objetivos da análise de agrupamentos 


e A análise de agrupamentos é usada para: 

e Descrição taxonômica: Identificar grupos naturais 
dentro dos dados 
Simplificação de dados: A habilidade de analisar 
grupos de observações semelhantes em vez de todas 
as observações individuais 
Identificação de relação: A estrutura simplificada 
da análise de agrupamentos retrata relações não 


reveladas de outra forma 


e Considerações teóricas, conceituais e práticas devem 
ser levadas em conta quando se selecionam variáveis de 
agrupamento para análise: 

e Somente variáveis que se relacionam 
especificamente com os objetivos da análise de 
agrupamentos são incluídas; variáveis irrelevantes 
não podem ser excluídas da análise uma vez que ela 
comece 
Variáveis selecionadas caracterizam os indivíduos 
(objetos) sendo agrupados 
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pesquisador entenda as implicações conceituais e práticas 
da inclusão e exclusão de variáveis da análise. 


Estágio 2: Projeto de pesquisa em 
análise de agrupamentos 


Com os objetivos definidos e as variáveis selecionadas, o 
pesquisador deve abordar quatro questões antes de come- 
çar o processo de partição: 


1. O tamanho da amostra é adequado? 

2. As observações atípicas podem ser detectadas e, se for o 
caso, devem ser eliminadas? 

+ Como a similaridade de objetos deve ser medida? 

« Os dados devem ser padronizados? 


BR w 


Muitas abordagens diferentes podem ser empregadas 
para responder a essas questões. No entanto, nenhuma 
delas foi avaliada suficientemente para fornecer uma res- 
posta definitiva e, infelizmente, muitos dos métodos for- 
necem resultados diferentes para o mesmo conjunto de 
dados. Logo, a análise de agrupamentos, juntamente com 
a análise fatorial, é tanto uma arte quanto uma ciência. 
Por essa razão, nossa discussão revê essas questões dando 
exemplos dos métodos mais comumente usados e avalian- 
do as limitações práticas sempre que possível. 

A importância dessas questões e das decisões tomadas 
em estágios posteriores se torna evidente quando perce- 
bemos que, apesar de a análise de agrupamentos buscar 
estrutura nos dados, ela deve na verdade impor uma es- 
trutura por meio de uma metodologia selecionada. A aná- 
lise de agrupamentos não pode avaliar todas as partições 
possíveis porque mesmo o problema relativamente pe- 
queno de dividir 25 objetos em 5 agrupamentos disjuntos 
envolve 2,431 x 10º partições possíveis [2]. Em vez disso, 
com base nas decisões do pesquisador, a técnica identifi- 
ca um pequeno subconjunto das possíveis soluções como 
“correto”. Desse ponto de vista, as questões do projeto da 
pesquisa e a escolha de metodologias feita pelo pesquisa- 
dor talvez tenham maior impacto do que com qualquer 
outra técnica multivariada. 


Tamanho da amostra 

A questão de tamanho amostral em análise de agrupa- 
mentos não se relaciona com quaisquer problemas de 
inferência estatística (ou seja, poder estatístico). Em vez 
disso, a amostra deve ser grande o bastante para forne- 
cer suficiente representação de pequenos grupos dentro 
da população e representar a estrutura inerente. Esta 
questão de representação se torna crítica na detecção de 
observações atípicas (ver a próxima seção), com a ques- 
tão principal sendo: quando uma observação atípica é de- 
tectada, ela é representativa de um grupo pequeno mas 
substantivo? Grupos pequenos irão naturalmente apare- 
cer como pequenas quantias de observações, particular- 
mente quando a amostra é pequena. Por exemplo, com 
tamanhos amostrais de 100 ou menos, grupos de até 10% 


da população podem ser representados por apenas uma 
ou duas observações devido ao processo de amostragem. 
Em tais casos a distinção entre observações atípicas e re- 
presentativas de um pequeno grupo é muito mais difícil 
de fazer. Amostras maiores aumentam a chance de que 
grupos pequenos sejam representados por casos suficien- 
tes para tornar a presença dos mesmos mais facilmente 
identificada. 

Como resultado, o pesquisador deve garantir que a 
amostra é suficientemente grande para adequadamente 
representar todos os grupos relevantes da população. Ao 
determinar o tamanho amostral, o pesquisador deve espe- 
cificar os tamanhos de grupos necessários para relevância 
às questões de pesquisa que são feitas. Obviamente, se 
os objetivos da análise demandam a identificação de pe- 
quenos grupos dentro da população, o pesquisador deve 
buscar amostras maiores. Se o pesquisador porém está in- 
teressado somente em grupos maiores (p.ex., segmentos 
importantes para campanhas promocionais), então a dis- 
tinção entre uma observação atípica e um representante 
de um pequeno grupo é menos importante e ambos po- 
dem ser tratados de uma maneira semelhante. 


Detecção de observações atípicas 

Na busca por estrutura, já discutimos como a análise de 
agrupamentos é sensível à inclusão de variáveis irrelevan- 
tes. Mas a análise de agrupamentos é igualmente sensível 
a observações atípicas (objetos diferentes de todos os ou- 
tros). As observações atípicas podem representar: 


e Observações verdadeiramente aberrantes que não são re- 
presentativas da população geral 

e Observações representativas de segmentos pequenos ou in- 
significantes na população, ou 

e Uma subamostragem de grupos reais na população que pro- 
voca uma representação ruim dos grupos na amostra. 


No primeiro caso, as observações atípicas distorcem a 
verdadeira estrutura e tornam os agrupamentos obtidos 
não-representativos da verdadeira estrutura da popula- 
ção. No segundo caso, a observação atípica é removida, de 
forma que os agrupamentos resultantes representam com 
maior precisão os segmentos relevantes na população. No 
entanto, no terceiro caso as observações atípicas devem 
ser incluídas nas soluções, mesmo que elas sejam mal re- 
presentadas na amostra, pois elas representam grupos vá- 
lidos e relevantes. Por esta razão, um exame preliminar 
para detectar observações atípicas é sempre necessário. 


Abordagens gráficas. Uma das maneiras mais fáceis 
de conduzir tal exame é preparar um diagrama de perfil 
gráfico, listando as variáveis ao longo do eixo horizon- 
tale os valores das variáveis ao longo do eixo vertical. 
Cada ponto do gráfico representa o valor da variável 
correspondente, e os pontos são conectados para faci- 
litar a interpretação visual. Perfis para todos os obje- 
tos são então colocados no gráfico, com uma linha para 
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cada objeto. As observações atípicas são os objetos com 
perfis muito diferentes, geralmente caracterizados por 
valores extremos em uma ou mais variáveis. Um exem- 
plo de diagrama de perfil gráfico é mostrado na Figura 
8-4. 


Abordagens empíricas. Apesar de simples, os procedi- 
mentos gráficos se tornam inadequados com um grande 
número de objetos e até mais difíceis quando o número de 
variáveis aumenta. Além disso, a detecção de observações 
atípicas deve se estender para além do método univaria- 
do, pois elas também podem ser definidas em um sentido 
multivariado como tendo perfis únicos em um conjunto 
inteiro de variáveis que as distinguem de todas as outras 
observações. Como resultado, uma medida empírica se 
faz necessária para facilitar comparações ao longo de ob- 
jetos. Para esses casos, os procedimentos para identificar 
observações atípicas discutidos no Capítulo 2 podem ser 
aplicados. A combinação de técnicas bivariadas e multi- 
variadas fornece um conjunto abrangente de ferramen- 
tas para identificação de observações atípicas sob muitas 
perspectivas. 

Outro método é identificar observações atípicas atra- 
vés de medidas de similaridade. Os exemplos mais óbvios 
de observações atípicas são observações singulares que 
são as mais distintas das demais. No entanto, usando esta 
técnica, o pesquisador está comprometido com a identifi- 
cação de observações atípicas somente após as soluções 
de agrupamento serem identificadas, o que requer pelo 
menos uma iteração (identificando observações atípicas, 
eliminando-as do conjunto de dados e, em seguida, ro- 
dando novamente a análise) na análise. À medida que o 
número de objetos a serem agregados aumenta, fica mais 
difícil identificar todas as observações atípicas sem múl- 
tiplas iterações. Além disso, algumas das abordagens de 
agrupamento são bastante sensíveis à remoção de apenas 
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uns poucos casos [14]. Assim, deve-se colocar ênfase na 
identificação de observações atípicas antes que a análise 
tenha início. 


Resumo. Seja qual for o método usado, observações 
identificadas como atípicas devem ser avaliadas quanto à 
sua representatividade da população e eliminadas da aná- 
lise se forem consideradas não-representativas. Como em 
outros casos de detecção de observações atípicas, o pes- 
quisador deve demonstrar cautela na eliminação de ob- 
servações da amostra, pois tal eliminação pode distorcer a 
estrutura real dos dados. 


Medidas de similaridade 

O conceito de similaridade é fundamental na análise de 
agrupamentos. A similaridade entre objetos é uma medi- 
da empírica de correspondência, ou semelhança, entre ob- 
jetos a serem agrupados. A comparação das duas técnicas 
de interdependência (análise fatorial e análise de agrupa- 
mentos) demonstrará como funciona a similaridade para 
definir estrutura em ambos os casos. 


e Em nossa discussão de análise fatorial, a matriz de correla- 
ção entre todos os pares de variáveis foi usada para agregar 
variáveis em fatores. O coeficiente de correlação representa 
a similaridade de cada variável com outra, quando vista ao 
longo de todas as observações. Assim, a análise fatorial reu- 
niu variáveis que tinham fortes correlações entre si. 

e Um processo comparável ocorre em análise de agrupamen- 
tos. Aqui, a medida de similaridade é calculada para todos 
os pares de objetos, com similaridade baseada no perfil de 
cada observação nas características especificadas pelo pes- 
quisador. Desse modo, qualquer objeto pode ser compara- 
do a qualquer outro por meio da medida de similaridade, 
exatamente como usamos correlações entre variáveis em 
análise fatorial. O procedimento de análise de agrupamen- 
tos então prossegue agregando objetos semelhantes em 
agrupamentos. 


Valor 


FIGURA 8-4 Diagrama de perfil. 


Variável 
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A similaridade entre objetos pode ser medida de di- 
versas maneiras, mas três métodos dominam as aplicações 
de análise de agrupamentos: medidas correlacionais, me- 
didas de distância e medidas de associação. Cada um des- 
ses métodos representa uma perspectiva particular sobre 
similaridade, dependendo de seus objetivos e do tipo de 
dados. Tanto as medidas correlacionais quanto as de dis- 
tância requerem dados métricos, ao passo que as medidas 
de associação são para dados não-métricos. 


Medidas correlacionais. A medida de similaridade entre 
objetos em que provavelmente se pensa em primeiro lugar 
é o coeficiente de correlação entre dois objetos medidos so- 
bre diversas variáveis. Com efeito, em vez de correlacionar 
dois conjuntos de variáveis, invertemos a matriz de dados, 
de forma que as colunas representam os objetos e as linhas 
correspondem às variáveis. Logo, o coeficiente de correla- 
ção entre as duas colunas de números é a correlação (ou 
similaridade) entre os perfis dos dois objetos. Altas corre- 
lações indicam similaridade (a correspondência de padrões 
ao longo das características) e baixas correlações denotam 


uma falta da mesma. Esse procedimento é seguido também 
na aplicação de análise fatorial do tipo Q (ver Capítulo 3). 


A abordagem correlacional é ilustrada usando o exem- 
plo de sete observações mostrado na Figura 8-4. Uma 
medida correlacional de similaridade não olha a mag- 
nitude, mas sim os padrões dos valores. Na Tabela 8-3, 
a qual contém as correlações entre essas sete observa- 
ções, podemos perceber dois grupos distintos. Primeiro, 
os casos 1, 5 e 7 têm padrões semelhantes e correlações 
correspondentes elevadas e positivas. Do mesmo modo, 
os casos 2, 4 e 6 também têm correlações positivas altas 
entre eles mesmos, mas correlações baixas ou negativas 
com as outras observações. O caso 3 tem correlações 
baixas ou negativas com todos os demais casos, de modo 
que talvez forme um grupo por si mesmo. 


Correlações representam padrões ao longo das variá- 
veis, muito mais do que as magnitudes, que são compa- 
ráveis a uma análise fatorial do tipo O (ver Capítulo 3). 


TABELA 8-3 Cálculo de medidas de similaridade correlacional e de distância 


Dados originais 


Caso X, X, X, X, X, 
1 7 10 9 7 10 
2 9 9 8 9 9 
3 5 5 6 7 7 
4 6 6 3 3 4 
5 1 2 2 1 2 
6 4 3 2 3 3 
7 2 4 5 2 5 

Medida de similaridade: correlação 
Caso 

Caso 1 2 3 4 5 6 7 
1 1,00 
2 —0,147 1,00 
3 0,000 0,000 1,00 
4 0,087 0,516 —0,824 1,00 
5 0,963 —0,408 0,000 —0,060 1,00 
6 —0,466 0,791 —0,354 0,699 —0,645 1,00 
7 0,891 —0,516 0,165 —0,239 0,963 —0,699 1,00 

Medida de similaridade: distância euclidiana 
Caso 

Caso 1 2 3 4 5 6 7 
1 ne 
2 3,32 nc 
3 6,86 6,63 ne 
4 10,25 10,20 6,00 ne 
5 15,78 16,19 10,10 7,07 nc 
6 13,11 13,00 7,28 3,87 3,87 ne 
7 11,27 12,16 6,32 5,10 4,90 4,36 ne 


nc = distâncias não-calculadas 
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Medidas correlacionais raramente são usadas, porque a 
ênfase na maioria das aplicações da análise de agrupa- 
mentos é nas magnitudes dos objetos, e não nos padrões 
de valores. 


Medidas de distância. Mesmo que as medidas correla- 
cionais tenham um apelo intuitivo e sejam usadas em mui- 
tas outras técnicas multivariadas, elas não são a medida 
de similaridade mais comumente empregada em análise 
de agrupamentos. Em vez disso, as medidas de similari- 
dade mais usadas são as de distância. Essas medidas de 
distância representam similaridade como proximidade de 
observações umas com as outras ao longo de variáveis na 
variável estatística de agrupamento. As medidas de dis- 
tância são, na verdade, uma medida de dissimilaridade, 
com valores maiores denotando menor similaridade. A 
distância é convertida em uma medida de similaridade 
pelo uso de uma relação inversa. 


Tipos de medida de distância. Uma ilustração sim- 
ples disso foi mostrada em nosso exemplo hipotético (ver 
Figura 8-2), no qual agrupamentos de observações foram 
definidos com base na proximidade de observações entre 
elas mesmas quando os escores de cada observação sobre 
duas variáveis foram representados graficamente. Ainda 
que proximidade possa parecer um conceito simples, di- 
versas medidas de distância estão disponíveis, cada uma 
com características específicas. 


e Distância euclidiana é a medida mais comumente reconhe- 
cida, muitas vezes chamada de distância em linha reta. Um 
exemplo de como a distância euclidiana é obtida é mos- 
trado geometricamente na Figura 8-5. Suponha que dois 
pontos em duas dimensões tenham coordenadas (X,, Y,) 
e (X,, Y,), respectivamente. A distância euclidiana entre 
os pontos é o comprimento da hipotenusa de um triângulo 
retângulo, conforme se calcula pela fórmula sob a figura. 
Esse conceito é facilmente generalizado para mais de duas 
variáveis. 

e Distância euclidiana quadrada (ou absoluta) é a soma dos 
quadrados das diferenças sem calcular a raiz quadrada. A 
distância euclidiana quadrada tem a vantagem de que não é 


necessário calcular a raiz quadrada, o que acelera sensivel- 
mente o tempo de computação, e é a distância recomendada 
para os métodos de agrupamento centróide e de Ward. 

e Distância city-block (de Manhattan) não é baseada na dis- 
tância euclidiana. No lugar disso, ela emprega a soma das 
diferenças absolutas das variáveis (isto é, os dois lados de 
um triângulo retângulo em vez da hipotenusa). Este proce- 
dimento é o mais simples de calcular, mas pode conduzir 
a agrupamentos inválidos se as variáveis forem altamente 
correlacionadas [26]. 

e Distância de Chebycheyv é outra medida. Com ela, a distân- 
cia é a maior diferença ao longo de todas as variáveis de 
agrupamento. Ela é particularmente suscetível a diferenças 
em escalas ao longo das variáveis (ver discussão adiante so- 
bre padronização). 

e Distância de Mahalanobis (D?) é uma medida generalizada 
de distância que explica as correlações entre variáveis de 
uma maneira que pondera igualmente cada uma delas. Ela 
também depende de variáveis padronizadas e é discutida 
com mais detalhes em uma seção posterior. Apesar de dese- 
jável em muitas situações, não está disponível como medida 
de proximidade em SAS ou SPSS. 


Essas e diversas outras variantes (outras formas de di- 
ferenças ou de potências de diferenças) estão disponíveis 
em muitos programas de agrupamento. O pesquisador é 
encorajado a explorar soluções alternativas de agrupa- 
mentos obtidas quando ele usa diferentes medidas de dis- 
tância em um esforço para melhor representar os padrões 
inerentes de dados. 


Comparação com medidas correlacionais. A dife- 
rença entre medidas correlacionais e de distância talvez 
possa ser melhor percebida novamente olhando a Figura 
8-4. As medidas de distância se concentram na magnitude 
dos valores e representam como casos similares os objetos 
que estão próximos, mesmo se eles tiverem padrões muito 
diferentes ao longo das variáveis. Em contraste, medidas 
de correlação se concentram sobre os padrões nas variá- 
veis e não consideram a magnitude das diferenças entre 
objetos. Examinemos nossas sete observações para ver 
como essas abordagens se diferenciam. 


Objeto 1 


Objeto 2 


X 


Distância = V (Xp — X)2 + (Yo — Y)2 


FIGURA 8-5 Um exemplo de distância euclidiana entre dois objetos medidos sobre duas variáveis, Xe Y. 
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A Tabela 8-3 contém os valores para as sete observações 
sobre as cinco variáveis (X, a X,), com medidas de simi- 
laridade baseadas em distância e correlação. Soluções de 
agrupamento usando qualquer medida de similaridade 
parecem indicar três agrupamentos, mas a pertinência 
em cada agrupamento é bastante diferente. 


e Com as distâncias menores representando maior simila- 
ridade, percebemos que os casos 1 e 2 formam um gru- 
po (distância de 3,32), e os casos 4,5, 6 e 7 (distâncias 
variando de 3,87 a 7,07) formam um outro. A distinção 
desses dois grupos um em relação ao outro se eviden- 
cia no sentido de que a menor distância entre os dois 
agrupamentos é de 10,20. Esses grupos representam 
observações com valores maiores versus menores. Um 
terceiro grupo, que consiste apenas no caso 3, difere dos 
outros dois grupos porque tem valores que são tanto 
altos quanto baixos. 

e Usando a correlação como a medida de similaridade, 
três agrupamentos também surgem. Primeiro, os casos 
1,5 e 7 são altamente correlacionados (0,891 a 0,963), 
como os casos 2, 4 e 6 (0,516 a 0,791). Além disso, as 
correlações entre agrupamentos geralmente são próxi- 
mas de zero ou mesmo negativas. Finalmente, o caso 3 
é novamente distinto dos outros dois agrupamentos e 
forma um agrupamento unitário. 


Uma medida correlacional se concentra em padrões e 
não na medida mais tradicional de distância, e requer uma 
interpretação diferente dos resultados pelo pesquisador. 
Em contraste, medidas de distância, as medidas de simi- 
laridade preferidas na maioria das aplicações de análise 
de agrupamentos, apresentam valores mais similares no 
conjunto de variáveis, mas os padrões podem ser bastante 
diferentes. Como resultado, perfis de centróides de gru- 
pos sobre as variáveis de agrupamento são mais úteis com 
medidas de distância do que com aquelas de correlação. 


Qual é a melhor medida de distância? Ao tentar 
selecionar uma medida particular de distância, o pesqui- 
sador deve lembrar dos seguintes avisos: 


e Diferentes medidas de distância ou uma mudança nas es- 
calas das variáveis podem conduzir a diferentes soluções 
de agrupamentos. Logo, é aconselhável usar diversas me- 
didas e comparar os resultados com padrões teóricos ou 
conhecidos. 

e Quando as variáveis estão correlacionadas (positiva ou ne- 
gativamente), a medida de distância de Mahalanobis prova- 
velmente é a mais adequada, pois ajusta correlações e pon- 
dera todas as variáveis igualmente. 

e Se o pesquisador deseja ponderar as variáveis de maneira 
diferenciada, há outros procedimentos disponíveis [19, 21]. 


Medidas de associação. Medidas de similaridade por as- 
sociação são usadas para comparar objetos cujas caracte- 
rísticas são medidas apenas em termos não-métricos (me- 
dida nominal ou ordinal). Como exemplo, respondentes 
podem dizer sim ou não a várias questões. Uma medida de 


associação poderia avaliar o grau de concordância entre 
cada par de respondentes. A forma mais simples de medi- 
da de associação seria o percentual de vezes em que ocorre 
concordância (ambos os respondentes dizem sim ou ambos 
dizem não a uma pergunta) no conjunto de questões. 

Extensões desse coeficiente simples de concordância 
foram desenvolvidas para acomodar variáveis nominais 
multicategóricas e até mesmo medidas ordinais. Muitos 
programas de computador, porém, têm suporte limitado 
para medidas de associação, e o pesquisador é forçado a 
primeiramente calcular as medidas de similaridade e en- 
tão entrar com a matriz de similaridade no programa de 
agrupamento. Textos sobre os vários tipos de medidas por 
associação podem ser encontrados em diversas fontes [8, 
13, 14,27]. 


Seleção de uma medida de similaridade. Apesar de três 
formas distintas de medida de similaridade estarem dispo- 
níveis, a forma mais usada e preferida é a de distância, por 
diversas razões. Primeiro, a medida de distância represen- 
ta melhor o conceito de proximidade, que é fundamental 
para a análise de agrupamentos. Medidas correlacionais, 
apesar de terem ampla aplicabilidade em outras técni- 
cas, representam padrões e não proximidade. Segundo, a 
análise de agrupamentos é tipicamente associada com ca- 
racterísticas medidas por variáveis métricas. Em algumas 
aplicações, características não-métricas dominam, mas 
mais frequentemente as características são representadas 
por medidas métricas, tornando novamente a distância 
a medida preferida. Assim, em qualquer situação, o pes- 
quisador dispõe de medidas de similaridade que podem 
representar a proximidade de objetos em um conjunto de 
variáveis métricas ou não-métricas. 


Padronização dos dados 

Com a medida de similaridade selecionada, o pesquisador 
deve abordar uma questão a mais: os dados devem ser pa- 
dronizados antes que as similaridades sejam calculadas? 
Para responder essa questão, ele deve considerar que a 
maioria das análises de agrupamento usando medidas de 
distância é bastante sensível a diferentes escalas ou mag- 
nitudes entre as variáveis. Em geral, variáveis com maior 
dispersão (ou seja, maiores desvios-padrão) têm maior 
impacto sobre o valor de similaridade final. Consideremos 
um exemplo para ilustrar o problema encontrado com to- 
das as medidas de distância que usam dados não-padroni- 
zados e as inconsistências entre soluções de agrupamentos 
quando a escala das variáveis é mudada. 


Suponha que três objetos, A, Be C, são medidos quanto 
a duas variáveis: 


1. Probabilidade de comprar a marca X (em percen- 
tuais) 

2. Tempo despendido assistindo comerciais para a 
marca X (medido em minutos ou segundos) 


(Continua) 
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(Continuação) 

Os valores para cada observação são exibidos na 
Tabela 8-4. A partir dessa informação calculamos três 
medidas de distância para cada par de objetos: euclidia 
simples, euclidiana ao quadrado e city-block. Agora ve- 
jamos como essas medidas são afetadas pelas escalas das 
duas variáveis em três cenários: 


e Cenário 1: Primeiro, calculamos os valores de distância 
com base em probabilidade de compra e tempo com 
comerciais em minutos. Essas distâncias, com valores 
menores indicando maior proximidade e similaridade, 
e suas ordenações, são mostradas na Tabela 8-4. Como 
podemos ver, os objetos mais parecidos (com a menor 
distância) são Be C, seguidos por A e C, com A e B 
sendo os menos parecidos (ou menos próximos). Tal 
ordenação vale para as três medidas de distância, mas 
a similaridade ou dispersão relativa entre objetos é a 
mais pronunciada na medida de distância euclidiana ao 
quadrado. 


e Cenário 2: A ordem de similaridades varia sensivelmen- 
te com a mudança de escalonamento de apenas uma das 
variáveis. Se medirmos o tempo de comercial em segun- 
dos no lugar de minutos (aumentando assim a dispersão 
dessa variável), então as ordens mudam (ver Tabela 
8-4). Os objetos B e C ainda são os mais parecidos, mas 
agora o par A-B é o segundo mais parecido e é quase 
idêntico à similaridade de B-C. O que aconteceu agora 
é que a escala da variável tempo dominou os cálculos, 
tornando a probabilidade de compra menos significante 
nos cálculos. 


Quando usamos minutos para medir tempo (Cená- 
rio 1), o par A-B é o menos parecido com uma margem 
considerável. O inverso é verdadeiro no cenário 2, po- 
rém, quando medimos tempo de comercial em minutos 
(a medida com menor dispersão do que quando feita em 
segundos), uma vez que a probabilidade de compra se 
torna dominante nos cálculos. 


TABELA 8-4 Variações em medidas de distância baseadas em escalas alternativas de dados 


Dados originais 


Tempo assistindo comerciais 


Objeto Probabilidade de compra Minutos Segundos 
A 60 3,0 180 
B 65 3,5 210 
(0) 63 4,0 240 


Cenário 1: Medidas de distância baseadas em probabilidade de compra e minutos de comercial assistido 


Distância euclidiana simples 


Distância euclidiana ao 


quadrado ou absoluta Distância city-block 


Par de objetos Valor Ordem Valor Ordem Valor Ordem 
A-B 5,025 3 25,25 3 5,5 3 
A-C 3,162 2 10,00 2 4,0 2 
B-C 2,062 1 4,25 1 2,5 1 


Cenário 2: Medidas de distância baseadas em probabilidade de compra e segundos de comercial assistido 


Distância euclidiana simples 


Distância euclidiana ao 


quadrado ou absoluta Distância city-block 


Par de objetos Valor Ordem Valor Ordem Valor Ordem 
A-B 30,41 2 925 2 35 3 
A-C 60,07 3 3,609 3 63 2 
B-C 30,06 1 904 1 32 1 


Cenário 3: Medidas de distância baseadas em valores padronizados de probabilidade de compra e minutos ou segundos de co- 


mercial assistido 


Distância euclidiana 


Distância euclidiana ao 


Valores padronizados simples quadrado ou absoluta Distância city block 
Probabilidade Minutos/segundos de 
Par de objetos de compra comercial assistido Valor Ordem Valor Ordem Valor Ordem 
A-B —1,06 —1,0 2,22 2 4,95 2 2,99 2 
A-C 0,93 0,0 2,33 3 5,42 3 3,19 3 
B-C 0,13 1,0 1,28 1 1,63 1 1579 1 
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O pesquisador deveria assim notar o impacto substan- 
cial que escalonamento de variáveis pode ter sobre a so- 
lução final. Variáveis de agrupamento devem ser padroni- 
zadas sempre que possível para evitar casos como aquele 
mostrado em nosso exemplo [3]. Examinamos agora di- 
versas abordagens de padronização disponíveis aos pes- 
quisadores. 


Padronização de variáveis. A forma mais comum de 
padronização é a conversão de cada variável em escores 
padrão (também conhecidos como escores Z) pela sub- 
tração da média e divisão pelo desvio-padrão para cada 
variável. Essa opção pode ser encontrada em todos os 
programas de computador e muitas vezes está até mes- 
mo diretamente incluída no procedimento de análise de 
agrupamentos. Essa é a forma geral de uma função de 
distância normalizada, a qual utiliza uma medida de dis- 
tância euclidiana tratável para uma transformação de 
normalização dos dados brutos. O processo converte 
cada escore de dados iniciais em um valor padronizado 
com uma média de O e um desvio-padrão de 1 e, em tro- 
ca, elimina o viés introduzido pelas diferenças nas esca- 
las dos vários atributos ou variáveis usados na análise. 


Os benefícios de padronização podem ser percebidos 
no Cenário 3 (ver Tabela 8-4), no qual duas variáveis 
(probabilidade de compra e tempo despendido em co- 
merciais) foram padronizadas antes de se computarem 
as três medidas de distância. Primeiro, é muito mais 
fácil comparar variáveis porque elas estão na mesma 
escala (uma média de O e desvio-padrão de 1). Valo- 
res positivos estão acima da média e valores negati- 
vos estão abaixo. A magnitude representa o número 
de desvios-padrão que o valor original está distante da 
média. Segundo, não há diferença nos valores padro- 
nizados quando apenas a escala muda. Por exemplo, 
quando padronizamos o tempo de exposição a comer- 
ciais, os valores são os mesmos medidos em minutos 
ou segundos. 


Assim, o uso de variáveis padronizadas realmente eli- 
mina os efeitos devido às diferenças de escala não apenas 
ao longo das variáveis, mas também para a mesma variá- 
vel. A necessidade de padronização é minimizada quando 
todas as variáveis são medidas na mesma escala de respos- 
ta (p.ex., uma série de questões de atitude), mas se torna 
muito importante sempre que variáveis usando diferentes 
escalas de medida são incluídas na análise. 


Uso de uma medida de distância padronizada. Uma 
medida de distância euclidiana que incorpora direta- 
mente um procedimento de padronização é a distância 
de Mahalanobis (D?. A abordagem de Mahalanobis não 
apenas executa um processo de padronização sobre os 
dados escalonando em termos dos desvios-padrão, mas 


também soma a variância-covariância interna de gru- 
pos, que ajusta correlações entre as variáveis. Conjun- 
tos altamente correlacionados de variáveis em análise de 
agrupamentos podem implicitamente superponderar um 
conjunto de variáveis nos procedimentos de agrupamen- 
to (ver discussão sobre multicolinearidade no estágio 3). 
Resumidamente, o procedimento de distância generali- 
zada de Mahalanobis computa uma medida de distância 
entre objetos comparável a R? em análise de regressão. 
Apesar de muitas situações serem apropriadas para o uso 
da distância de Mahalanobis, nem todos os programas a 
incluem como medida de similaridade. Em tais casos, o 
pesquisador geralmente seleciona a distância euclidiana 
ao quadrado. 


Padronização por observação. Até agora, discutimos a 
padronização apenas de variáveis. Por que poderíamos 
padronizar respondentes ou casos? Consideremos um 
exemplo simples. 


Suponha que coletemos várias avaliações em uma escala 
de 10 pontos quanto à importância de diversos atributos 
em decisões de compra de um produto. Poderíamos apli- 
car a análise de agrupamentos e obter agregados, mas 
uma possibilidade bem diferenciada é que obteríamos 
agregados de pessoas que dizem que tudo é importan- 
te, outras que dizem que tudo tem pouca importância, 
e talvez alguns agrupamentos sejam intermediários. O 
que estamos vendo são padrões de respostas específicos 
de um indivíduo. Tais padrões podem refletir uma forma 
específica de resposta a um conjunto de questões, como 
os que dizem sim (respondem favoravelmente a todas as 
questões) ou os que dizem não (respondem desfavora- 
velmente a todas as questões). 


Esses padrões dos que dizem sim e dos que dizem não 
representam aquilo que se chama de efeitos de estilo de 
resposta. Se quisermos identificar grupos de acordo com 
seu estilo de resposta e até mesmo controlar tais padrões, 
então a padronização típica através do cálculo de escores 
Z não é adequada. O que se deseja na maioria dos casos é 
a importância relativa de uma variável em relação a outra 
para cada indivíduo. Em outras palavras, o atributo 1 é 
mais importante do que os outros atributos, e agrupamen- 
tos de respondentes podem ser encontrados com padrões 
similares de importância? Nesse caso, a padronização por 
respondente uniformizaria cada questão não para a média 
da amostra, mas para o escore médio daquele responden- 
te. Essa padronização interna ou centrada em linha pode 
ser muito efetiva para remover efeitos de estilo de respos- 
ta e é especialmente adequada para muitas formas de da- 
dos de atitude [25]. Devemos notar que isso é semelhante 
a uma medida correlacional no destaque do padrão nas 
variáveis, mas a proximidade de casos ainda determina o 
valor de similaridade. 
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REGRAS PRÁTICAS 8-2 


Planejamento de pesquisa em análise de agrupamentos 


O tamanho exigido da amostra não se baseia em considerações estatísticas para teste de inferência, mas sim nos seguintes 
aspectos: 
e Tamanho suficiente é necessário para garantir representatividade da população e sua estrutura inerente, particularmente 
de grupos pequenos na população 
e Tamanhos mínimos de grupos são baseados na relevância de cada grupo para a questão de pesquisa e na confiança 
necessária para caracterizar aquele grupo 
Medidas de similaridade calculadas no conjunto inteiro de variáveis de agrupamento permitem agregar observações e 
compará-las umas com as outras 
e Medidas de distância são mais frequentemente usadas como medidas de similaridade, com valores maiores 
representando maior distinção (distância entre casos) e não semelhança 
Medidas de distância incluem: 
Distância euclidiana (em linha reta), a medida de distância mais comum 
Distância euclidiana ao quadrado, a soma de distâncias quadradas e a medida recomendada para os métodos de 
agrupamento centróide e de Ward 
Distância de Mahalanobis explica correlações de variáveis e pondera igualmente cada variável; mais adequada 
quando as variáveis são altamente correlacionadas 
e Menos fregiientemente usadas são as medidas correlacionais, quando grandes valores indicam similaridade 
Dada a sensibilidade de alguns procedimentos à medida de similaridade usada, o pesquisador deve empregar diversas 
medidas de distância e comparar os resultados de cada uma com outros resultados ou padrões teóricos/conhecidos 
Observações atípicas podem distorcer severamente a representatividade dos resultados se elas aparecerem como estrutural 
(agrupamentos) inconsistente com os objetivos da pesquisa 
e Observações atípicas devem ser removidas se elas representarem: 
e Observações aberrantes não representativas da população 
e Observações de segmentos pequenos ou insignificantes na população e sem interesse para os propósitos da pesquisa 
e Elas devem ser mantidas se forem uma representação subamostral/ruim de grupos relevantes na população; a amostra 
deve ser aumentada para garantir representação desses grupos 
Observações atípicas podem ser identificadas com base na medida de similaridade via: 
e Descoberta de observações com grandes distâncias das demais observações 
e Diagramas de perfil gráfico que destacam casos atípicos 
e O surgimento delas em soluções de agrupamentos como membros únicos ou agrupamentos pequenos 
Variáveis de agrupamento devem ser padronizadas sempre que possível para evitar problemas resultantes do emprego de 
diferentes valores de escala entre as mesmas 
e À conversão de padronização mais comum são os escores Z 
e Se grupos são identificados de acordo com o estilo de resposta de um indivíduo, então a padronização interna ou 
centrada em linha mostra-se adequada 


Devemos padronizar? A padronização fornece uma 
ação corretiva para uma questão fundamental em me- 
didas de similaridade, particularmente de distância, e 
muitos recomendam seu amplo uso [11, 13]. No entanto, 
o pesquisador não deve aplicar padronização sem consi- 
derar suas consequências na remoção de alguma relação 
natural refletida no escalonamento das variáveis, embo- 
ra outros tenham dito que este procedimento pode ser 
apropriado [1]. Alguns pesquisadores demonstram que 
a padronização pode nem mesmo apresentar efeitos ob- 
serváveis [7, 17]. Assim, não há uma razão única que nos 


Estágio 3: Suposições em 
análise de agrupamentos 


A análise de agrupamentos, como o escalonamento mul- 
tidimensional (ver Capítulo 9), não é uma técnica de in- 
ferência estatística na qual os parâmetros a partir de uma 
amostra são avaliados como possivelmente representati- 
vos de uma população. Em vez disso, a análise de agru- 
pamentos é uma metodologia para quantificar as caracte- 
rísticas estruturais de um conjunto de observações. Como 
tal, ela tem fortes propriedades matemáticas, mas sem 
fundamentos estatísticos. As exigências de normalidade, 


diga para usarmos variáveis padronizadas versus não-pa- 
dronizadas. A decisão de padronização deve ser baseada 
em questões empíricas e conceituais que reflitam os ob- 
jetivos da pesquisa e as qualidades empíricas dos dados. 


linearidade e homocedasticidade, que eram tão impor- 
tantes em outras técnicas, realmente têm pouco peso na 
análise de agrupamentos. O pesquisador deve, contudo, 
se concentrar em duas outras questões críticas: represen- 
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tatividade da amostra e multicolinearidade entre variáveis 
na variável estatística de agrupamento. 


Representatividade da amostra 

Raramente o pesquisador tem um censo da população 
para usar na análise de agrupamentos. Geralmente, uma 
amostra de casos é obtida e os agrupamentos determina- 
dos na esperança de que representem a estrutura da po- 
pulação. O pesquisador deve, portanto, estar confiante de 
que a amostra obtida é verdadeiramente representativa 
da população. Como já mencionado, observações atípicas 
podem realmente ser apenas uma subamostra de grupos 
divergentes que, quando descartadas, introduzem viés na 
estimação da estrutura. O pesquisador deve perceber que 
a análise de agrupamentos é apenas tão boa quanto a re- 
presentatividade da amostra. Portanto, todos os esforços 
devem ser feitos para garantir que a amostra seja repre- 
sentativa e que os resultados sejam generalizáveis para a 
população de interesse. 


Impacto de multicolinearidade 

A multicolinearidade foi uma questão em outras técnicas 
multivariadas por causa da dificuldade em discernir o ver- 
dadeiro impacto de variáveis multicolineares. Em análise 
de agrupamentos o efeito é diferente, porque multicoline- 
aridade é na realidade uma forma de ponderação implíci- 
ta. Comecemos com um exemplo que ilustra o efeito da 
multicolinearidade. 


Suponha que respondentes estejam sendo agrupados 
quanto a 10 variáveis, todas declarações de atitudes pe- 
rante um serviço. Quando a multicolincaridade é exami- 
nada, percebemos que há dois conjuntos de variáveis, o 
primeiro composto de oito declarações e o segundo con- 
sistindo das duas declarações restantes. Se nosso objeti- 
vo é realmente agrupar os respondentes nas dimensões 
do serviço (neste caso representadas pelos dois grupos 
de variáveis), então o uso das 10 variáveis originais será 
bastante enganoso. Como cada variável é ponderada 
igualmente em análise de agrupamentos, a primeira di- 
mensão terá quatro vezes mais chances (oito itens com- 
parados com dois) de afetar a medida de similaridade. 
Como resultado, a similaridade será predominantemen- 
te afetada pela primeira dimensão com oito itens em vez 
da segunda dimensão com dois itens. 


Multicolinearidade atua como um processo de ponde- 
ração não visível para o observador, mas que afeta a análi- 
se. Por essa razão, o pesquisador é encorajado a examinar 
as variáveis usadas em análise de agrupamentos em busca 
de multicolincaridade substancial, e, se encontrada, redu- 
zir as variáveis a números iguais em cada conjunto ou usar 
uma das medidas de distância, como a de Mahalanobis, 
que compensa essa correlação. 


Uma última questão é sobre o uso de escores fatoriais 
em análise de agrupamentos. O debate se centra na pes- 
quisa, mostrando que as variáveis que verdadeiramen- 
te discriminam entre os grupos inerentes não são bem 
representadas na maioria das soluções fatoriais. Assim, 
quando escores fatoriais são empregados, é bem possível 
que uma representação ruim da verdadeira estrutura dos 
dados seja obtida [23]. O pesquisador deve lidar tanto 
com a multicolinearidade quanto com a discriminação 
das variáveis para atingir a melhor representação de es- 
trutura. 


Estágio 4: Determinação de agrupamentos 
e avaliação do ajuste geral 


Com as variáveis de agrupamento selecionadas e a matriz 
de similaridade calculada, o processo de partição tem iní- 
cio (ver Figura 8-6). O pesquisador deve: 


e Escolher o procedimento de partição usado para formar 
agregados 
e Decidir o número de agrupamentos a serem formados. 


Ambas as decisões têm implicações substanciais não 
apenas nos resultados que serão obtidos, mas também na 
interpretação que pode ser obtida a partir dos resultados. 
Primeiro examinamos os procedimentos disponíveis de 
partição e em seguida discutimos as opções à disposição 
para decidir sobre uma solução definindo o número de 
agrupamentos e a pertinência para cada observação. 


Procedimentos de partição 

A primeira pergunta importante a responder no desen- 
volvimento de uma solução de agrupamento envolve a 
escolha do procedimento de partição (ou seja, o conjunto 
de regras mais apropriadas para colocar objetos seme- 
lhantes em grupos ou agregados). Essa não é uma questão 
simples, pois centenas de programas de computador que 
usam diferentes algoritmos estão disponíveis, e outros 
mais estão sempre em desenvolvimento. O critério essen- 
cial de todos os algoritmos, porém, é que eles tentam ma- 
ximizar as diferenças entre agrupamentos relativamente 
à variação dentro dos mesmos, como se mostra na Figura 


REGRAS PRÁTICAS 8-3 


Suposições em análise de agrupamentos 


e Variáveis de entrada devem ser examinadas 
quanto a substancial multicolinearidade, e se a 


multicolinearidade se confirmar: 

e Reduzir as variáveis a números iguais em cada 
conjunto de medidas correlacionadas, ou 
Usar uma medida de distância que compense a 
correlação, como a distância de Mahalanobis 
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8-7. A razão entre a variação entre agrupamentos e varia- 
ção interna média é então comparável (mas não idêntica) 
à razão F em análise de variância. 

Uma vasta gama de procedimentos de partição tem 
sido desenvolvida nas disciplinas em que a análise de agru- 
pamentos se aplica. Os algoritmos mais comumente usa- 
dos podem ser classificados como: (1) hierárquicos e (2) 
não-hierárquicos. Diversos outros procedimentos (p.ex., 
agrupamentos fuzzy, métodos grafo-teóricos, redes neu- 


rais, modelos evolucionários e métodos baseados em bus- 
ca) estão igualmente disponíveis [13, 15]. Devido à popu- 
laridade das abordagens hierárquicas e não-hierárquicas 
de partição, nossa discussão será limitada às mesmas. 


Procedimentos hierárquicos de agrupamento 

Procedimentos hierárquicos envolvem uma série den — 1 
decisões de agrupamento (sendo n o número de observa- 
ções) que combinam observações em uma estrutura de 


Do 
estágio 


3 


Estágio 4 


Seleção de um algoritmo de agrupamento 


É hierárquico, não-hierárquico ou uma 
combinação dos dois métodos usados? 


| 
Métodos hierárquicos 


Métodos não-hierárquicos 


Combinação 


Métodos de ligação disponíveis: Métodos de designação disponíveis: Usar um método hierárquico para 
Referência sequencial 
Referência paralela 


Ligação simples 
Ligação completa 
Ligação média 
Método de Ward 
Método centróide | 


Otimização 


Quantos agrupamentos são formados? 


Examinar aumentos no coeficiente de aglomeração 
Examinar dendrograma e o diagrama vertical 
Considerações conceituais 


| 


Seleção de pontos sementes 


especificar pontos sementes de 
agrupamento para um método 
não-hierárquico 


Reespecificação da análise de agrupamentos 


Alguma observação foi eliminada como: 


Atípica? 


Sim 


Membro de um agrupamento pequeno? 


Não 


| 


Estágio 5 


Interpretação dos agrupamentos 


Examinar centróides de agrupamento 
Nomear agrupamentos com base nas variáveis 


de agrupamento 


Estágio 6 


Validação e caracterização dos agrupamentos 


Validação com variáveis de resultado 


selecionadas 


Caracterização com variáveis descritivas 


adicionais 


FIGURA 8-6 Estágios 4-6 do diagrama de decisão da análise de agrupamentos. 
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«— Variação entre agrupamentos 
--- > Variação dentro dos agrupamentos 


E, 


FIGURA 8-7 Diagrama de agrupamento mostrando variação entre e dentro dos agrupamentos. 


hierarquia ou do tipo árvore. Os dois tipos básicos de pro- 
cedimentos hierárquicos de agrupamento são aglomerati- 
vos e divisivos. Nos métodos aglomerativos, cada objeto 
ou observação começa como seu próprio agrupamento; 
nos métodos divisivos, todas as observações iniciam com 
um único agrupamento e são sucessivamente divididas 
(primeiro em dois agrupamentos, depois em três e assim 
por diante), até que cada observação seja um agrupamen- 
to unitário. Na Figura 8-8, os métodos aglomerativos se 
movem da esquerda para a direita e os divisivos seguem 
da direita para a esquerda. Como os pacotes de computa- 
dor mais comumente usados empregam métodos aglome- 
rativos, e pelo fato de métodos divisivos atuarem quase 
como métodos aglomerativos ao contrário, concentramo- 
nos aqui nas técnicas aglomerativas. 

Para compreendermos como funciona um procedi- 
mento hierárquico, examinamos a forma mais comum — 


o método aglomerativo — que segue um processo simples 
e repetitivo: 


1. Começar com todas as observações como formando seus 
próprios agrupamentos (ou seja, cada observação forma um 
agrupamento unitário), de forma que o número de agrupa- 
mentos seja igual ao de observações. 

2. Usando a medida de similaridade, combinar os dois agrupa- 
mentos mais parecidos em um novo (agora contendo duas 
observações), reduzindo assim a quantia de agrupamentos 
em uma unidade. 

3. Repetir o processo novamente, usando medida de similarida- 
de para combinar os dois agrupamentos mais parecidos em 
um novo. 

4. Continuar este processo, combinando em cada passo os dois 
agrupamentos mais semelhantes em um novo. Repetir o 
processo em um total de n — 1 vezes até que todas as obser- 
vações estejam contidas em um só agrupamento. 


——— Aglomerativo 


2 
02 


Número da observação 


= 
(9) 


3 


4 5 6 7 


«——— Divisivo 


FIGURA 8-8 Dendrograma ilustrando agrupamento hierárquico. 
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Considere que temos 100 observações. Começaríamos 
inicialmente com 100 agrupamentos separados, cada 
um contendo uma observação. No primeiro passo, os 
dois agrupamentos mais parecidos seriam combinados, 
deixando-nos com 99 agrupamentos. No próximo passo, 
combinamos os dois agrupamentos mais parecidos, de 
forma que ficamos então com 98. Este processo continua 
até o último passo, no qual dois agrupamentos remanes- 
centes são combinados em um único. 


Uma característica importante dos procedimentos 
hierárquicos é que os resultados de um estágio anterior 
são sempre aninhados com os resultados de um estágio 
posterior, criando algo parecido com uma árvore. Por 
exemplo, uma solução de seis agrupamentos é obtida pela 
junção de dois dos agrupamentos encontrados no estágio 
de sete agregados. Como os agrupamentos são formados 
apenas pela junção de agrupamentos existentes, qualquer 
elemento de um agregado pode delinear sua pertinência 
em um caminho ininterrupto até seu início como uma ob- 
servação isolada. Esse processo é exibido na Figura 8-8; a 
representação é chamada de dendrograma ou gráfico em 
árvore. Um outro método gráfico popular é o diagrama 
vertical. 


Algoritmos de agrupamento. O algoritmo de aglome- 
ração em um procedimento hierárquico determina como 
similaridade é definida entre agrupamentos de múltiplos 
membros no processo. Já discutimos os métodos (corre- 
lação, distância ou associação) usados para medir simila- 
ridade entre observações. Portanto, como medimos simi- 
laridade entre agrupamentos quando um deles ou ambos 
apresentam múltiplos membros? Selecionamos um mem- 
bro para atuar como elemento típico e medimos similari- 
dade entre esses membros de cada agrupamento, criamos 
algum membro composto para representar o agrupamen- 
to, combinamos similaridades entre todos os membros 
de cada agrupamento? Poderíamos empregar qualquer 
uma dessas abordagens, ou até mesmo estabelecer outras 
maneiras de medir similaridade entre agrupamentos de 
múltiplos membros. Entre numerosas metodologias, os 
cinco algoritmos aglomerativos mais populares são (1) li- 
gação individual, (2) ligação completa, (3) ligação média, 
(4) método centróide e (5) método de Ward. Em nossas 
discussões, usamos distância como medida de similarida- 
de entre observações, mas outras medidas poderiam ser 
igualmente utilizadas. 


Ligação simples. O método de ligação simples (tam- 
bém conhecido como método do vizinho mais próximo) 
define a semelhança entre agrupamentos como a menor 
distância de qualquer objeto de um agrupamento a qual- 
quer objeto no outro. Tal regra foi aplicada no exemplo 
do início deste capítulo e permite usar a matriz original de 
distância entre observações sem calcular novas medidas. 


Basta encontrar todas as distâncias entre observações nos 
dois agrupamentos e escolher a menor como medida de 
similaridade entre agrupamentos. 

Tal abordagem é provavelmente o algoritmo aglo- 
merativo mais versátil, pois ele pode definir uma vasta 
gama de padrões de aglomeração (p.ex., pode represen- 
tar agrupamentos que são círculos concêntricos, como os 
anéis de um alvo). Esta flexibilidade também cria proble- 
mas, porém, quando os agrupamentos são mal delinea- 
dos. Em tais casos, procedimentos de ligação simples po- 
dem formar longas e sinuosas cadeias [15, 20]. Indivíduos 
nos extremos opostos de uma cadeia podem ser diferen- 
tes, apesar de ainda estarem no mesmo agrupamento. 
Muitas vezes, a presença de tais cadeias pode contrastar 
com os objetivos de se obterem os agrupamentos mais 
compactos. Assim, o pesquisador deve examinar cuida- 
dosamente os padrões de observação dentro dos agru- 
pamentos para averiguar se tais cadeias estão ocorren- 
do. Isto se torna cada vez mais difícil por meios gráficos 
quando o número de variáveis de agrupamento aumenta, 
e requer que o pesquisador caracterize cuidadosamente 
a homogeneidade interna entre as observações em cada 
agrupamento. 


Um exemplo dessa situação é mostrado na Figura 8-9. 
Três agrupamentos (A, Be C) devem ser reunidos. O 
algoritmo de ligação simples, concentrando-se apenas 
nos pontos mais próximos de cada agregado, conectaria 
os agrupamentos A e B por causa de sua pequena dis- 
tância nos extremos dos agrupamentos. A reunião dos 
agregados A e B cria um agrupamento que circunda 
C. Mesmo assim, ao procurar homogeneidade interna, 
seria muito melhor juntar C com A ou B. Essa figura 
mostra a principal desvantagem do algoritmo de liga- 
ção simples. 


Ligação completa. O método de ligação comple- 
ta (também conhecido como o método do vizinho mais 
distante ou o método do diâmetro) é comparável ao da 
ligação simples, exceto que a similaridade de agrupamen- 
to se baseia em distância máxima entre observações em 
cada agrupamento. Similaridade entre agrupamentos é a 
menor esfera (diâmetro mínimo) que pode incluir todas 
as observações em ambos os agrupamentos. Esse método 
é chamado de ligação completa porque todos os objetos 
em um agrupamento são conectados uns com os outros a 
alguma distância máxima. Assim, a similaridade interna 
se iguala ao diâmetro do grupo. 

Essa técnica elimina o problema de encadeamento 
identificado na ligação simples, e descobriu-se que ela gera 
as soluções mais compactas [3]. Ainda que ela represente 
apenas um aspecto dos dados (ou seja, a maior distância 
entre membros), muitos pesquisadores a consideram a 
mais apropriada para inúmeras aplicações [12]. 
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FIGURA 8-9 Exemplo de uma ligação simples unindo agrupamentos distintos A e B. 


A Figura 8-10 compara as menores (ligação simples) e as 
maiores (ligação completa) distâncias que representam 
similaridade entre agrupamentos. Ambas as medidas re- 
fletem apenas um aspecto dos dados. O uso da ligação 
simples reflete somente um par de objetos mais próxi- 
mos, e a ligação completa também reflete um único par, 
desta vez os dois mais extremos. 


Ligação média. O método de ligação média dife- 
re dos procedimentos de ligação simples e completa no 
sentido de que a similaridade de quaisquer dois agrupa- 
mentos é a similaridade média de todos os indivíduos em 
um agrupamento com todos os indivíduos em outro. Este 
algoritmo não depende de valores extremos (pares mais 
próximos ou mais afastados), como ocorre com ligação 
simples ou completa. Em vez disso, a similaridade é ba- 
seada em todos os elementos dos agregados, e não em um 
único par de membros extremos, e é desse modo menos 


afetada por observações atípicas. Abordagens de ligação 
média, como um tipo de meio-termo entre métodos de li- 
gação simples e completa, tendem a gerar agregados com 
pequena variação interna. Elas também tendem a produ- 
zir agregados com aproximadamente a mesma variância 
interna. 

Método centróide. No método centróide, a similari- 
dade entre dois agrupamentos é a distância entre seus cen- 
tróides. Centróides são os valores médios das observações 
sobre as variáveis na variável estatística de agrupamen- 
to. Neste método, toda vez que indivíduos são reunidos, 
um novo centróide é computado. Os centróides migram 
quando ocorrem fusões de agregados. Em outras pala- 
vras, existe uma mudança no centróide do agrupamento 
toda vez que um novo indivíduo ou grupo de indivíduos é 
acrescentado a um agregado já existente. 

Esses métodos são os mais populares nas ciências físi- 
cas (p.ex., biologia) mas podem produzir resultados fre- 


Mais curta 


Ligação simples 


Mais longa 


Ligação completa 


FIGURA 8-10 Comparação de medidas de distância para ligação simples e completa. 
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quentemente confusos. A confusão acontece por causa de 
inversões, ou seja, casos em que a distância entre os cen- 
tróides de um par pode ser menor do que a distância entre 
os centróides de outro par fundido em uma combinação 
anterior. A vantagem desse método, como o método de 
ligação média, é que ele é menos afetado por observações 
atípicas do que outros métodos hierárquicos. 


Método de Ward. O método de Ward difere das téc- 
nicas anteriores no sentido de que a similaridade entre 
dois agrupamentos não é uma única medida de similari- 
dade, mas a soma dos quadrados dentro dos agrupamen- 
tos feita sobre todas as variáveis. É muito parecido com a 
medida de heterogeneidade simples usada no exemplo do 
início do capítulo para auxiliar na determinação do núme- 
ro de agrupamentos. No procedimento de Ward, a seleção 
de qual par de agrupamentos a combinar é baseada em 
qual combinação de agregados minimiza a soma interna 
de quadrados no conjunto completo de agrupamentos se- 
parados ou disjuntos. Em cada passo, os dois agrupamen- 
tos combinados são aqueles que minimizam o aumento na 
soma total de quadrados em todas as variáveis em todos 
os agrupamentos. 

Esse procedimento tende a combinar agrupamentos 
com um pequeno número de observações, pois a soma de 
quadrados é diretamente relacionada com o número de 
observações envolvidas. O uso de uma medida de soma 
de quadrados torna este método facilmente distorcido por 
observações atípicas [17]. Além disso, o método de Ward 
também tende a produzir agregados com aproximada- 
mente o mesmo número de observações. Se o pesquisador 
espera ou deseja que os padrões de agrupamento reflitam 
agregados com aproximadamente o mesmo tamanho, en- 
tão tal técnica é bastante adequada. Contudo, o empre- 
go desta abordagem também torna mais difícil identificar 
agrupamentos que representem pequenas proporções da 
amostra. 


Visão geral. Procedimentos de agrupamento hierárqui- 
co são uma combinação de um processo repetitivo para 
agregar com um algoritmo de agrupamento, para definir 
a similaridade entre agregados com múltiplos membros. 
O processo de criação de agrupamentos gera um diagra- 
ma em árvore que representa as combinações/divisões de 
agrupamentos para formar o intervalo completo de solu- 
ções. Deve ser observado que procedimentos hierárqui- 
cos geram um conjunto completo de soluções, variando 
de agregados em que todos são unitários até a solução de 
um só agrupamento no qual todas as observações estão 
em um só conjunto. Fazendo isso, o procedimento hierár- 
quico fornece um excelente referencial para se comparar 
qualquer conjunto de soluções de agrupamentos. 


Procedimentos não-hierárquicos de agrupamento 
Diferentemente dos métodos hierárquicos, os procedi- 
mentos não-hierárquicos não envolvem o processo de 


construção em árvore. Em vez disso, designam objetos a 
agrupamentos assim que o número de agregados a serem 
formados tenha sido especificado. Por exemplo, uma solu- 
ção de seis agrupamentos não é apenas uma combinação 
de dois agrupamentos a partir da solução de sete agrega- 
dos, mas é baseada apenas na descoberta da melhor solu- 
ção com seis agregados. O processo essencialmente tem 
dois passos: 


1. Especificar sementes de agrupamento: A primeira tarefa é 
identificar pontos de partida, conhecidos como sementes de 
agrupamento, para cada agregado. Uma semente de agru- 
pamento pode ser pré-especificada pelo pesquisador ou ob- 
servações podem ser escolhidas, geralmente em um proces- 
so aleatório. 

2. Designação: Com as sementes de agrupamento definidas, 
o próximo passo é designar cada observação a uma das se- 
mentes de agrupamento com base em similaridade. Mui- 
tas abordagens estão disponíveis para fazer tal designação 
(ver discussão adiante nesta seção), mas o objetivo básico 
é designar cada observação à semente mais parecida. Em 
algumas abordagens, observações podem ser redesignadas 
a agrupamentos que são mais semelhantes do que suas de- 
signações originais. 


Discutimos na próxima seção diferentes técnicas para 
escolher sementes de agrupamento e para designar ob- 
jetos. 


Seleção de pontos sementes. Ainda que os algoritmos 
não-hierárquicos de agrupamento discutidos na próxima 
seção se diferenciem na maneira como eles designam ob- 
servações aos pontos sementes, todos eles enfrentam o 
mesmo problema: como escolhemos as sementes de agru- 
pamento? As diferentes abordagens podem ser classifica- 
das em duas categorias básicas: 


1. Especificada pelo pesquisador. Nesta técnica, o pesquisador 
fornece os pontos sementes baseado em dados externos. As 
duas fontes mais comuns de pontos sementes são pesquisas 
anteriores ou dados de outra análise multivariada. Muitas 
vezes o pesquisador tem conhecimento sobre os perfis de 
agrupamento pesquisados. Por exemplo, uma pesquisa an- 
terior pode ter definido perfis de segmento, e a tarefa da 
análise de agrupamentos é designar indivíduos ao agrupa- 
mento de segmento mais apropriado. É possível também 
que outras técnicas multivariadas possam ser usadas para 
gerar os pontos semente. Um exemplo comum é o emprego 
de um algoritmo hierárquico de agrupamento para estabe- 
lecer o número de agregados e então gerar pontos semente 
a partir desses resultados (uma descrição mais detalhada 
desta técnica está contida na próxima seção). O elemento 
em comum é que o pesquisador, ao mesmo tempo que sabe 
a quantia de agregados a serem formados, tem também in- 
formação sobre o caráter básico desses agrupamentos. 

2. Gerada pela amostra. A segunda técnica é gerar as sementes 
a partir de observações da amostra, de maneira sistemática 
ou simplesmente através de seleção ao acaso. Por exemplo, 
no programa FASTCLUS em SAS, a primeira semente é a 
primeira observação no conjunto de dados sem valores per- 
didos. A segunda semente é a próxima observação completa 
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(sem dados perdidos) que é separada da primeira semente 
por uma distância mínima especificada. A opção padrão é 
uma distância mínima nula. Depois que todas as sementes 
foram selecionadas, o programa designa cada observação ao 
agrupamento com a semente mais próxima. O pesquisador 
pode especificar que as sementes sejam revisadas (atualiza- 
das) pelo cálculo das médias de agrupamento de sementes 
cada vez que uma observação é designada. Em contraste, 
o programa QUICK CLUSTER em SPSS pode selecionar 
aleatoriamente os pontos sementes necessários a partir das 
observações. Em qualquer uma dessas técnicas, o pesquisa- 
dor confia no processo de seleção para escolher pontos se- 
mentes que reflitam agrupamentos naturais como pontos de 
partida para os algoritmos de agrupamento. Uma limitação 
é que a repetição dos resultados é difícil se as observações 
são reordenadas ou se o processo de seleção aleatória é ini- 
ciado unicamente cada vez. 


Em qualquer uma das abordagem o pesquisador deve 
estar ciente do impacto do processo de escolha da semen- 
te sobre os resultados finais. Todos os algoritmos de agru- 
pamento, incluindo aqueles de natureza de otimização 
(ver discussão adiante), geram diferentes soluções, depen- 
dendo das sementes iniciais. Espera-se que as diferenças 
entre soluções de agrupamento sejam mínimas ao se usar 
diferentes sementes, mas elas enfatizam a importância da 
seleção de sementes e seu impacto na solução final. 


Algoritmos de agrupamento não-hierárquico. Com as 
sementes definidas, o pesquisador deve agora escolher um 
dos três algoritmos de agrupamento [9]. Todos eles são 
frequentemente chamados de agrupamentos de K-mé- 
dias, e eles são parecidos em seu método básico para de- 
signar observações a agrupamentos, mas variam no grau 
em que cada observação pode ser novamente designada 
entre agrupamentos após a designação inicial. 


Referência segiiencial. O método da referência 
seqiiencial começa pela seleção de uma semente de 
agrupamento e inclui todos os objetos dentro de uma 
distância pré-especificada. Quando todos os objetos 
dentro da distância são incluídos, uma segunda semente 
de agrupamento é selecionada e todos os objetos dentro 
da distância pré-especificada são incluídos. Em seguida, 
uma terceira semente é selecionada e o processo con- 
tinua como anteriormente. A principal desvantagem 
desta técnica é que quando um objeto é designado a um 
agrupamento, ele não pode ser novamente designado 
a outro agrupamento, mesmo que a semente seja mais 
parecida. 


Referência paralela. Em contraste, o método da 
referência paralela considera todas as sementes de agru- 
pamento simultaneamente e designa observações dentro 
da distância de referência até a semente mais próxima. À 
medida que o processo evolui, as distâncias de referência 
podem ser ajustadas para incluir menos ou mais observa- 
ções nos agrupamentos. Além disso, em algumas variantes 


desse método, observações permanecem não agrupadas se 
estiverem fora da distância de referência pré-especificada 
a partir de qualquer semente de agrupamento. 


Otimização. O terceiro método, chamado de pro- 
cedimento de otimização, é semelhante aos outros dois 
métodos não-hierárquicos, exceto em que ele permite a 
redesignação de observações. Se, no curso da designação 
de observações, uma delas se torna mais próxima de um 
outro agregado que não é o agrupamento no qual ela está 
associada no momento, então um procedimento de otimi- 
zação transfere a observação para o agregado mais seme- 
lhante (mais próximo). 


Métodos hierárquicos ou não- 

hierárquicos devem ser usados? 

Uma resposta definitiva a essa questão não pode ser dada 
por dois motivos. Primeiro, o problema de pesquisa em 
mãos pode sugerir um método ou o outro. Segundo, o que 
aprendemos com aplicação contínua a um contexto em 
particular pode sugerir um método em vez de outro como 
mais adequado para aquele contexto. Podemos examinar 
as vantagens e desvantagens de cada método para deter- 
minar qual é mais adequado para um dado ambiente de 
pesquisa. 


Prós e contras de métodos hierárquicos. Técnicas de 
agrupamento hierárquico são há muito as mais popula- 
res, sendo o método de Ward e a ligação média prova- 
velmente os mais facilmente disponíveis [17]. Além do 
fato de que procedimentos hierárquicos foram os pri- 
meiros métodos de agrupamento desenvolvidos, eles 
ainda oferecem várias vantagens que resultam em seu 
amplo uso: 


1. Simplicidade: Técnicas hierárquicas, com seu desenvolvi- 
mento de estruturas em árvore retratando o processo de 
agrupamento, equipam o pesquisador com uma descrição 
simples, ainda que abrangente, de todo o intervalo de so- 
luções de agrupamento. Fazendo isso, o pesquisador pode 
avaliar qualquer uma das soluções possíveis a partir de 
uma análise. 

2. Medidas de similaridade: O amplo uso dos métodos hierár- 
quicos conduz a um extenso desenvolvimento de medidas 
de similaridade para praticamente quaisquer tipos de variá- 
veis de agrupamento. Técnicas hierárquicas podem ser apli- 
cadas a quase todo tipo de questão de pesquisa. 

3. Rapidez: Os procedimentos hierárquicos têm a vantagem de 
gerarem o conjunto inteiro de soluções de agrupamento (de 
todos os agrupamentos separados a um só) de uma maneira 
oportuna. Tal habilidade permite ao pesquisador examinar 
uma vasta gama de soluções alternativas, variando medidas 
de similaridade e métodos de ligação de uma maneira efi- 
ciente. 


Ainda que técnicas hierárquicas tenham sido bastante 
usadas, elas apresentam diversas desvantagens que afe- 
tam todas as suas soluções: 
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1. Métodos hierárquicos podem ser enganosos, pois combina- 
ções iniciais indesejáveis podem persistir na análise e con- 
duzir a resultados artificiais. Uma preocupação específica 
é o impacto substancial de observações atípicas nos méto- 
dos hierárquicos, particularmente com o método de ligação 
completa. 

2. Para reduzir o impacto de observações atípicas, o pesquisa- 
dor pode querer analisar os dados em grupo diversas vezes, 
e a cada momento eliminar observações problemáticas ou 
atípicas. A eliminação de casos, contudo, mesmo dos que 
não forem tidos como atípicos, muitas vezes pode distorcer 
a solução. Assim, o pesquisador deve ter extremo cuidado 
na eliminação de observações por qualquer razão. 

3. Apesar de a computação do processo de agrupamentos 
ser relativamente rápida, os métodos hierárquicos não são 
tratáveis para analisar amostras muito grandes. Quando 
o tamanho amostral aumenta, as exigências de armazena- 
mento de dados aumentam dramaticamente. Por exem- 
plo, uma amostra de 400 casos demanda armazenamento 
de aproximadamente 80.000 similaridades, o que aumenta 
para quase 125.000 em uma amostra de 500. Mesmo com 
os avanços tecnológicos dos computadores pessoais de hoje, 
tais exigências podem limitar a aplicação em muitos casos. 
O pesquisador pode considerar uma amostra aleatória das 
observações originais para reduzir o tamanho amostral, mas 
agora deve questionar a representatividade da amostra to- 
mada a partir da amostra original. 


Surgimento de métodos não-hierárquicos. Os métodos 
não-hierárquicos obtiveram crescente aceitabilidade e 
uso, mas qualquer aplicação depende da habilidade do 
pesquisador para selecionar os pontos sementes de acor- 
do com alguma base prática, objetiva ou teórica. Nesses 
casos, os métodos não-hierárquicos têm diversas vanta- 
gens sobre as técnicas hierárquicas. 


1. Os resultados são menos suscetíveis a observações atípicas 
nos dados, à medida de distância usada e à inclusão de va- 
riáveis irrelevantes ou inadequadas. 

2. Métodos não-hierárquicos podem analisar conjuntos ex- 
tremamente grandes de dados, pois eles não demandam o 
cálculo de matrizes de similaridade entre todas as observa- 
ções, mas somente a similaridade de cada observação com 
os centróides de agrupamento. Mesmo os algoritmos de oti- 
mização que permitem a redesignação de observações entre 
agrupamentos podem ser prontamente aplicados em todos 
os tamanhos de conjuntos de dados. 


Apesar de métodos não-hierárquicos apresentarem 
várias vantagens, algumas deficiências podem afetar con- 
sideravelmente o emprego dos mesmos em muitos tipos 
de aplicação. 


1. Os benefícios de qualquer método não-hierárquico são per- 
cebidos apenas com o emprego de pontos sementes não-ale- 
atórios (ou seja, especificados). Assim, o uso de técnicas não- 
hierárquicas com pontos sementes aleatórios é geralmente 
considerado inferior em relação às técnicas hierárquicas. 

2. Mesmo uma solução inicial não-aleatória não garante um 
agrupamento ótimo de observações. Na verdade, em muitos 
casos, o pesquisador conseguirá uma solução final diferente 


para cada conjunto de pontos sementes especificados. Como 
o pesquisador irá selecionar a resposta ótima? Somente com 
a análise e validação o pesquisador pode selecionar o que 
é considerado a melhor representação de estrutura, perce- 
bendo que muitas alternativas podem ser aceitáveis. 

3. Métodos não-hierárquicos também não são tão eficientes 
quando se examinam grandes quantias de soluções poten- 
ciais de agrupamento. Cada solução é uma análise em sepa- 
rado, em contraste com as técnicas hierárquicas que geram 
todas as soluções possíveis em uma só análise. Logo, técni- 
cas não-hierárquicas não demonstram serem tão adequadas 
na exploração de um grande intervalo de soluções com base 
em elementos que variam como medidas de similaridade, 
observações incluídas e potenciais sementes. 


Uma combinação de ambos os métodos. Com cada 
abordagem tendo distintas vantagens e desvantagens, há 
quem proponha que se usem ambas (hierárquica e não- 
hierárquica) para conseguir os benefícios de cada uma 
[17]. Fazendo isso, as vantagens de cada método são utili- 
zadas para compensar as desvantagens do outro, o que se 
consegue em dois passos: 


1. Primeiro, uma técnica hierárquica é usada para gerar um 
conjunto completo de soluções, estabelecer as soluções apli- 
cáveis (ver próxima seção para uma discussão sobre este 
tópico), caracterizar os centros de agrupamentos para atua- 
rem como pontos sementes, e identificar quaisquer observa- 
ções atípicas óbvias. 

2. Depois que os casos atípicos foram eliminados, as demais 
observações podem então ser agrupadas por um método 
não-hierárquico com os centros de grupos dos resultados 
hierárquicos como os pontos sementes iniciais. 


Desse modo, as vantagens dos métodos hierárquicos 
são complementadas pela habilidade dos métodos não- 
hierárquicos para refinar os resultados, pela possibilidade 
de alteração de pertinência a grupos. 


A análise de agrupamentos deve ser reespecificada? 
Mesmo antes de identificar uma solução aceitável de aná- 
lise de agrupamento (ver próxima seção), o pesquisador 
deve examinar a estrutura fundamental representada nos 
grupos definidos. De particular interesse são os tamanhos 
de agrupamentos amplamente diferentes ou agrupamen- 
tos de apenas uma ou duas observações. Geralmente, 
agrupamentos de um só membro ou muito pequenos não 
são aceitáveis dados os objetivos da pesquisa e, assim, de- 
vem ser eliminados. 

Os pesquisadores devem examinar os tamanhos de 
agrupamentos que sejam muito distintos a partir de uma 
perspectiva conceitual, comparando os resultados reais 
com as expectativas formadas nos objetivos da pesquisa. 
Mais problemáticos são os agrupamentos unitários, os 
quais podem ser casos atípicos não detectados em análises 
anteriores. Se um agrupamento unitário (ou com tamanho 
muito pequeno, comparado com outros grupos) surgir, o 
pesquisador deve decidir se ele representa uma compo- 
nente estrutural válida na amostra ou se deve ser elimi- 
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nado como não-representativo. Se alguma observação for 
eliminada, especialmente quando soluções hierárquicas 
são empregadas, o pesquisador deve novamente executar 
a análise de agrupamentos e recomeçar o processo de de- 
finição de grupos. 


Quantos agrupamentos devem ser formados? 

Talvez a questão mais desconcertante para qualquer pes- 
quisador que executa uma análise de agrupamentos hie- 
rárquica ou não-hierárquica seja a determinação do nú- 
mero de agrupamentos mais representativos da estrutura 
de dados da amostra [6]. Tal decisão é crítica para técnicas 
hierárquicas, pois ainda que o processo gere um conjun- 
to completo de soluções de agrupamento, o pesquisador 
deve escolher as soluções que representam a estrutura de 
dados (também conhecida como a regra de parada). Esta 
decisão também é encarada pelo pesquisador em análises 


REGRAS PRÁTICAS 8-4 


não-hierárquicas quando a melhor solução deve ser sele- 
cionada entre duas ou mais soluções. 

Infelizmente, não existe um procedimento de seleção 
padrão e objetivo [5, 11]. Como não há critério estatísti- 
co interno usado para inferência, como os testes de sig- 
nificância estatística de outros métodos multivariados, os 
pesquisadores desenvolveram muitos critérios para tratar 
do problema. Os principais problemas que surgem diante 
dessas regras de parada incluem os seguintes: 


e Esses procedimentos ad hoc devem ser computados pelo 
pesquisador e muitas vezes envolvem técnicas bastante 
complexas [1, 18]. 

e Muitos desses critérios são específicos de um programa par- 
ticular de computador e não são facilmente calculados se 
não forem fornecidos pelo programa. 

e Um aumento natural na heterogeneidade surge a partir da 
redução no número de agrupamentos. Assim, o pesquisador 


Obtenção de agrupamentos 


e Métodos hierárquicos de agrupamento diferem na metodologia de representação de similaridade entre agrupamentos, cada 


um com vantagens e desvantagens: 


e Ligação simples é provavelmente o algoritmo mais versátil, mas estruturas de agrupamento mal planejadas dentro dos 
dados produzem cadeias sinuosas de agrupamentos inaceitáveis 
Ligação completa elimina o problema de encadeamento, mas considera apenas as observações mais extremas de um 
agrupamento, sendo afetada, portanto, por observações atípicas 
Ligação média é baseada na similaridade média de todos os indivíduos em um agrupamento e tende a gerar agregados 
com pouca variação interna e é menos afetada por observações atípicas 
Ligação centróide mede distância entre centróides de agrupamento e, como a ligação média, é menos afetada por 


observações atípicas 


Método de Ward se baseia na soma total de quadrados dentro de agrupamentos e é mais apropriado quando o 
pesquisador espera agrupamentos de algum modo parecidos em tamanho, mas é facilmente distorcido por observações 


atípicas 


e Métodos não-hierárquicos de agrupamento requerem que o número de agrupamentos seja especificado antes de se 


designar observações: 


e O método da referência sequencial designa observações ao agrupamento mais próximo, mas uma observação não pode 
ser redesignada a outro agrupamento seguindo sua designação original 
e Procedimentos de otimização permitem a redesignação de observações com base na proximidade sequencial de 
observações com agrupamentos formados durante o processo 
e À escolha entre métodos hierárquicos e não-hierárquicos se baseia no que se segue: 


e Soluções hierárquicas são preferidas quando: 


e Muitas ou todas as soluções alternativas devem ser examinadas 
e O tamanho da amostra é moderado (abaixo de 300-400, não excedendo 1.000) ou uma amostra de um conjunto maior 


de dados é aceitável 
e Métodos não-hierárquicos são preferidos quando: 


e O número de agrupamentos é conhecido e pontos sementes iniciais podem ser especificados de acordo com alguma 


base prática, objetiva ou teórica 


e Observações atípicas provocam preocupação, pois métodos não-hierárquicos são geralmente menos suscetíveis a 


observações atípicas 


e Uma combinação usando a abordagem hierárquica seguida de um método não-hierárquico é freqientemente aconselhável 
e Um método não-hierárquico* é utilizado para selecionar o número de agrupamentos e para caracterizar os centros de 
agrupamento que servem como sementes iniciais no procedimento não-hierárquico 
Um método não-hierárquico então agrega todas as observações usando os pontos sementes para fornecer alocações 


mais precisas 


* N.de R.T.: A frase correta seria “Um método hierárquico”. 
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deve observar as tendências nos valores dessas regras de pa- 
rada ao longo das soluções para identificar aumentos signi- 
ficativos. Caso contrário, na maioria dos casos a solução de 
dois agrupamentos sempre seria escolhida, pois o valor de 
qualquer regra de parada é normalmente mais alto quando 
passa de dois para um agrupamento. 


Mesmo com as similaridades entre as regras de parada, 
elas exibem diferenças suficientes para colocá-las em uma 
entre duas classes gerais, como descrito a seguir. 


Medidas de mudança de heterogeneidade. Uma classe de 
regras de parada examina alguma medida de heterogenei- 
dade entre agrupamentos em cada passo sucessivo, com a 
solução de agrupamento definida quando a medida de he- 
terogeneidade excede um valor especificado ou quando os 
valores sucessivos entre etapas dão um salto repentino. Um 
exemplo simples foi usado no início do capítulo, o qual bus- 
cou grandes aumentos na distância interna média. Quando 
um grande aumento acontece, o pesquisador seleciona a 
solução anterior sob o argumento de que sua combinação 
provocou um aumento substancial de heterogeneidade. Foi 
mostrado que esse tipo de regra de parada fornece decisões 
bastante precisas em estudos empíricos [18], mas não é in- 
comum que várias soluções de agrupamento sejam iden- 
tificadas por esses grandes aumentos na heterogeneidade. 
Portanto, é tarefa do pesquisador a escolha de uma solução 
final a partir dessas soluções selecionadas. Várias regras de 
parada seguem essa abordagem geral. 


Variações percentuais de heterogeneridade.  Prova- 
velmente a regra mais simples e mais amplamente usada 
é uma simples variação percentual de alguma medida de 
heterogeneidade. Um exemplo típico é o emprego do coe- 
ficiente de aglomeração em SPSS, que mede heterogenei- 
dade como a distância na qual agregados são formados (se 
uma medida de similaridade baseada em distância for usa- 
da) ou a soma de quadrados dentro do agrupamento se o 
método de Ward for empregado. Com esta medida, o au- 
mento percentual no coeficiente de aglomeração pode ser 
calculado para cada solução. Em seguida o pesquisador 
seleciona soluções de agrupamento como uma potencial 
solução final quando o aumento percentual é considera- 
velmente maior do que o que ocorre em outros passos. 


Medidas de variação de variância. A raiz do desvio 
padrão quadrático médio (RMSSTD) é a raiz quadrada 
da variância do novo agrupamento formado pela união de 
dois agregados. A variância para o novo agregado é cal- 
culada como a variância ao longo de todas as variáveis de 
agrupamento. Grandes aumentos na RMSSTD sugerem 
a união de dois agrupamentos bastante distintos, indican- 
do que a solução anterior (na qual os dois agrupamentos 


*N. de R. T.: Supondo que a intenção dos autores seja denotar k- 
ésima e (k-1)-ésima soluções com k e k-1 agupamentos, respectiva- 
mente, a frase correta seria “...indicam que a k-ésima solução é mais 
adequada do que a (k-1)-ésima solução”. 


eram separados) era uma candidata para escolha como a 
solução final. 


Medidas estatísticas de variação de heterogenei- 
dade. Uma série de testes estatísticos tenta retratar o 
grau de heterogeneidade para cada solução nova (ou seja, 
unindo-se dois agregados). Uma das mais usadas é uma 
estatística pseudo F, que compara a adequação de ajuste 
de k agrupamentos para k —1 agrupamentos. Valores alta- 
mente significantes indicam que a (k —1)-ésima solução é 
mais adequada do que a k-ésima solução*. O pesquisador 
não deve considerar qualquer valor significante, mas deve 
olhar aqueles valores que são consideravelmente mais sig- 
nificantes do que para outras soluções. 

Outra medida comumente utilizada é um valor pseu- 
do T”, que usa T” de Hotelling para comparar as médias 
dos agrupamentos unidos ao longo de todas as variáveis. 
Novamente, valores significantes dessa medida, que são 
consideravelmente maiores do que aqueles para outras 
soluções, indicam que a união de dois agrupamentos cria 
elevada heterogeneidade e justifica a solução com os dois 
agregados separados. 


Medidas diretas de heterogeneidade. Uma segunda 
classe geral de regras de parada tenta medir diretamen- 
te a heterogeneidade de cada solução de agrupamento. A 
medida mais comum nesta classe é o critério de agrupa- 
mento cúbico (CCC) [18] contido em SAS, uma medida 
do desvio dos agregados a partir de uma distribuição es- 
perada de pontos formada por uma distribuição uniforme 
multivariada. Aqui o pesquisador escolhe a solução com o 
maior valor de CCC (ou seja, a solução na qual CCC atin- 
ge seu máximo) [24]. Apesar de sua inclusão em SAS e de 
sua vantagem na seleção de uma solução única de agrupa- 
mento, ele se mostrou responsável pela geração de exces- 
sivos agrupamentos como solução final [18] e se baseia na 
suposição de que as variáveis não são correlacionadas. No 
entanto, é uma medida amplamente usada e é geralmente 
tão eficiente quanto qualquer outra regra de parada [18]. 


Resumo. Dado o número de regras de parada disponí- 
veis e a falta de evidência embasando qualquer regra em 
especial, sugere-se que o pesquisador empregue diversas 
regras de parada e procure por uma solução que seja con- 
senso. Não obstante, mesmo com um consenso baseado 
em medidas empíricas, o pesquisador deve complemen- 
tar o julgamento empírico com qualquer conceituação de 
relações teóricas que possa sugerir um número natural 
de agrupamentos. Pode-se começar esse processo pela 
especificação de alguns critérios baseados em considera- 
ções práticas, como dizer “Minhas descobertas serão mais 
fáceis de lidar e de comunicar se eu tiver de três a seis 
grupos”, e então escolher entre estes números de agrupa- 
mentos e selecionar a melhor alternativa depois de avaliar 
todas elas. Na análise final, porém, provavelmente será 
melhor computar várias soluções diferentes (p.ex., duas, 
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Obtenção da solução final de agrupamentos 


Nenhum procedimento objetivo em especial está 
disponível para determinar a quantia correta de 
agrupamentos; o pesquisador deve avaliar soluções 
alternativas pensando nas seguintes considerações para 
selecionar a solução ótima: 

e Agrupamentos de um só membro ou extremamente 
pequenos são geralmente não aceitáveis e devem ser 
eliminados 
Para métodos hierárquicos, regras de parada ad hoc, 
com base na taxa de variação em uma medida de 
similaridade total quando o número de agregados 
aumenta ou diminui, são uma indicação do número 
de agrupamentos 
Todos os agrupamentos devem ser 
significativamente diferentes no conjunto de 
variáveis 
Soluções, em última instância, devem ter validade 
teórica avaliada por meio de validação externa 


três, quatro) e então decidir entre as soluções alternativas 
pelo uso de um critério a priori, julgamento prático, senso 
comum ou fundamentação teórica. As soluções de agru- 
pamentos serão melhoradas pela restrição da solução de 
acordo com aspectos conceituais do problema. 


Estágio 5: Interpretação dos agrupamentos 


O estágio de interpretação envolve o exame de cada agru- 
pamento em termos da variável estatística de agrupamen- 
to para nomear ou designar um rótulo que descreva pre- 
cisamente a natureza dos agregados. Para esclarecer esse 
processo, examinemos o exemplo dos refrigerantes diet 
versus normais. 


Consideremos que foi desenvolvida uma escala de atitu- 
des que consiste em declarações relativas ao consumo de 
refrigerantes, como “refrigerantes diet têm um sabor mais 
desagradável”, “refrigerantes normais têm um sabor mais 
forte”, “bebidas diet são mais saudáveis” e assim por dian- 
te. Além disso, consideremos que dados demográficos e de 
consumo de refrigerantes também tenham sido coletados. 


Quando iniciamos o processo de interpretação, uma 
medida frequentemente usada é o centróide de agrupa- 
mento. Se o procedimento de agrupamento foi realizado 
sobre os dados iniciais, essa será uma descrição lógica. Se 
os dados fossem padronizados ou se a análise de agrupa- 
mentos fosse executada usando a análise fatorial (fatores 
componentes), o pesquisador teria de voltar aos escores 
iniciais para as variáveis originais e computar os perfis 
médios usando esses dados. 


Continuando com nosso exemplo de refrigerantes, nesse 
estágio examinamos os perfis de escores médios sobre as 
declarações de atitude para cada grupo e atribuímos um 
rótulo descritivo para cada grupo. Muitas vezes, a aná- 
lise discriminante é aplicada para gerar perfis de escore, 
mas devemos lembrar que diferenças estatisticamente 
significantes não indicariam uma solução ótima, porque 
diferenças estatísticas são esperadas, dado o objetivo da 
análise de agrupamentos. O exame dos perfis permite 
uma rica descrição de cada agrupamento. Por exemplo, 
dois dos agrupamentos podem ter atitudes favoráveis 
sobre refrigerantes diet, e o terceiro agregado, atitudes 
negativas. Além disso, dos dois grupos favoráveis, um 
pode exibir atitudes favoráveis apenas para refrigeran- 
tes diet, ao passo que o outro pode mostrar atitudes 
favoráveis para refrigerantes diet e normais. A partir 
desse procedimento analítico, avaliaríamos as atitudes 
de cada agrupamento e desenvolveríamos interpreta- 
ções relevantes para facilitar o processo de rotulação de 
cada um. Por exemplo, um agrupamento poderia ser ro- 
tulado como “consciente quanto a saúde e calorias”, ao 
passo que um outro talvez fosse chamado de “um pouco 
de açúcar vai bem”. 


O perfil e a interpretação dos agrupamentos, porém, 
conseguem mais do que apenas a descrição e são elementos 
essenciais na seleção entre soluções quando as regras de 
parada indicam mais de uma solução de agrupamentos. 


e Eles fornecem um meio de avaliar a correspondência dos 
agregados obtidos com aqueles propostos por alguma teoria 
anterior ou por experiência prática. Se usados de um modo 
confirmatório, os perfis da análise de agrupamentos forne- 
cem um meio direto para avaliar a correspondência. 

e Os perfis de agrupamento também fornecem uma rota para 
fazer avaliações de significância prática. O pesquisador 
pode requerer que existam diferenças substanciais em um 
conjunto de variáveis de agrupamento e que a solução seja 
expandida até surgirem tais diferenças. 


Na avaliação de correspondência ou significância prá- 
tica, o pesquisador compara os agrupamentos obtidos com 
uma tipologia pré-concebida. Este julgamento mais subje- 
tivo do pesquisador combina com o julgamento empírico 
das regras de parada para determinar a solução final para 
representar a estrutura de dados da amostra. 


Estágio 6: Validação e perfil dos agrupamentos 


Dada a natureza um tanto subjetiva da análise de agrupa- 
mentos na seleção de uma solução ótima, o pesquisador 
deve ter muito cuidado na validação e na garantia de sig- 
nificância prática da solução final. Apesar de não haver 
qualquer método para garantir validade e significância 
prática, diversas abordagens foram propostas para forne- 
cer alguma base para a avaliação do pesquisador. 
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Validação da solução de agrupamentos 

A validação inclui tentativas do pesquisador para garantir 
que a solução de agrupamentos seja representativa da po- 
pulação geral, e assim seja generalizável para outros obje- 
tos e estável com o passar do tempo. 


Validação cruzada. A abordagem mais direta em rela- 
ção a isso é a análise de agrupamentos de amostras se- 
paradas, que compara as soluções e avalia a correspon- 
dência dos resultados. Essa técnica, contudo, geralmente 
é impraticável por causa de restrições de tempo ou custo, 
ou indisponibilidade de objetos (particularmente consu- 
midores) para múltiplas análises de agrupamentos. Nesses 
casos, um método comum é particionar a amostra em dois 
grupos. Cada um é analisado separadamente e os resul- 
tados são então comparados. Outras abordagens incluem 
(1) uma forma modificada de partição de amostra, onde 
centros de grupos obtidos a partir de uma solução são em- 
pregados para definir agrupamentos de outras observa- 
ções e os resultados são comparados [16], e (2) uma forma 
direta de validação cruzada [22]. 


Estabelecimento de validade de critério. O pesquisa- 
dor também pode tentar estabelecer alguma forma de 
validade de critério ou preditiva. Para isso, ele seleciona 
variáveis não usadas para formar agrupamentos mas que 
se sabe que têm variação ao longo dos grupos. Em nosso 
exemplo, podemos saber, de pesquisa anterior, que ati- 
tudes relacionadas a refrigerantes diet variam de acordo 
com a idade. Assim, podemos testar estatisticamente as 
diferenças em idade entre os agrupamentos favoráveis a 
refrigerantes diet e os que não o são. A(s) variável(eis) 
usada(s) para avaliar a validade preditiva devem ter forte 
apoio teórico ou prático, uma vez que se tornam padrões 
de referência para seleção de soluções de agrupamentos. 


Perfil da solução por agrupamento 

O estágio de perfil envolve a descrição das caracte- 
rísticas de cada agrupamento para explicar como eles 
podem diferir em dimensões relevantes. Este processo 
geralmente envolve o uso de análise discriminante (ver 
Capítulo 5). O procedimento tem início depois que os 
agrupamentos são identificados. O pesquisador utiliza 
dados não previamente incluídos no procedimento de 
agrupamento para caracterizar cada agregado. Esses 
dados normalmente são características demográficas, 
perfis psicográficos, padrões de consumo e assim por 
diante. Embora possa não haver um fundamento teó- 
rico para suas diferenças ao longo dos agregados, tal 
como se exige para avaliação de validade preditiva, tais 
diferenças devem pelo menos ter importância prática. 
Usando a análise discriminante, o pesquisador compara 
os perfis de escores médios dos agrupamentos. A variá- 
vel dependente categórica é a identificação prévia dos 
grupos, e as variáveis independentes são as característi- 
cas demográficas, psicográficas etc. 


A partir dessa análise, assumindo significância estatís- 
tica, o pesquisador pode concluir, por exemplo, que o 
grupo “consciente quanto a saúde e calorias” de nosso 
exemplo anterior sobre refrigerante diet consiste de pro- 
fissionais com melhor educação e maior renda e que são 
consumidores moderados de refrigerantes. 


Em resumo, a análise de perfil se concentra na descri- 
ção não daquilo que diretamente determina os agregados, 
mas das características dos agrupamentos depois da sua 
identificação. Além disso, a ênfase está nas características 
que diferem significantemente ao longo dos agrupamentos 
e nas que poderiam prever a pertinência a um agregado 
em particular. Frequentemente, o perfil é um passo prá- 
tico importante em procedimentos de agrupamento, pois 
identificar características como as demográficas permite 
que segmentos sejam identificados ou localizados com in- 
formação facilmente obtida. 


RESUMO DO PROCESSO DE DECISÃO 


A análise de agrupamentos fornece aos pesquisadores um 
método empírico e objetivo para realizar uma das tarefas 
mais naturais para os seres humanos -— classificação. Seja 
para fins de simplificação, exploração ou confirmação, 
a análise de agrupamentos é uma poderosa ferramenta 
analítica que conta com uma vasta gama de aplicações. 
Mas junto com essa técnica vem uma responsabilidade 
para o pesquisador, no sentido de aplicar os princípios 
inerentes de forma adequada. Como mencionado na in- 
trodução deste capítulo, a análise de agrupamentos tem 
muitas advertências, que fazem com que mesmo o pes- 
quisador experiente a aplique com cuidado. Mas quando 
usada apropriadamente, ela tem o potencial de revelar 
estruturas dentro dos dados que não poderiam ser des- 
cobertas por outros meios. Assim, essa técnica potente 
supre uma necessidade fundamental dos pesquisadores 
em todas as áreas, mas pode ser aplicada com o conheci- 
mento de que é muito fácil usá-la tanto de maneira equi- 
vocada quanto de forma apropriada. 


UM EXEMPLO ILUSTRATIVO 


Para ilustrar a aplicação de técnicas de análise de agrupa- 
mento, retornemos à base de dados da HBAT. As percep- 
ções de cliente da HBAT fornecem uma base para ilustrar 
um dos usos mais comuns da análise de agrupamentos — a 
formação de segmentos de clientes. Em nosso exemplo, 
seguimos os estágios do processo de construção de mode- 
los, começando com o estabelecimento de objetivos, em 
seguida abordando questões de delineamento de pesquisa, 
e finalmente classificando os respondentes em agregados e 
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Interpretação, caracterização e 
validação de agrupamentos 


e O centróide de agrupamento, um perfil médio do 
agrupamento sobre cada variável, é particularmente útil 
no estágio de interpretação: 

e Interpretação envolve o exame de características 
de diferenciação do perfil de cada agrupamento 
e a identificação de diferenças substanciais entre 
agregados 
Soluções que não conseguem mostrar variação 
significante indicam que outras soluções devem ser 
examinadas 
O centróide de agrupamento também deve 
ser avaliado quanto à correspondência com as 
expectativas anteriores do pesquisador com base em 
teoria ou experiência prática 

Validação é essencial em análise de agrupamentos 

porque os agregados são descritivos de estrutura e 

demandam suporte adicional quanto a sua relevância: 

e Validação cruzada valida empiricamente uma solução 
pela criação de duas subamostras (aleatoriamente 
dividindo a amostra) e então compara as duas 
soluções quanto a consistência relativa ao número de 
agrupamentos e os perfis dos mesmos 
Validação também é conseguida com o exame de 
diferenças sobre variáveis não incluídas na análise, 
mas para as quais uma razão teórica e relevante 
permite a expectativa de variação ao longo dos 
agrupamentos 


interpretando e validando os resultados. As seções a seguir 
detalham esses procedimentos por meio de cada estágio. 


Estágio 1: Objetivos da análise 
de agrupamentos 


Iniciamos pela análise das avaliações feitas por clientes da 
HBAT quanto ao desempenho da HBAT nos 13 atributos 
(X,a X,;). Fazendo isso, o pesquisador deve identificar os 
objetivos a serem alcançados e as características (variá- 
veis) usadas no processo de agrupamento. 


Objetivos de agrupamento 

A análise de agrupamentos pode atingir qualquer combi- 
nação de três objetivos: desenvolvimento de taxonomia, 
simplificação de dados e identificação de relações. Nesta 
situação, a HBAT está principalmente interessada na seg- 
mentação de clientes, apesar de serem possíveis usos adi- 
cionais dos segmentos derivados. 


O principal objetivo é desenvolver uma taxonomia que 
particione objetos (clientes) em grupos com percep- 


ções similares. Uma vez identificados, a HBAT pode 
então formular estratégias com diferentes apelos para 
os grupos separados — a base para segmentação de mer- 
cado. A análise de agrupamentos, com seu objetivo de 
formar grupos homogêneos que sejam tão distintos uns 
dos outros quanto possível, fornece uma metodologia 
única para desenvolver taxonomias com relevância ad- 
ministrativa máxima. 

Além de formar uma taxonomia que pode ser usa- 
da para segmentação, a análise de agrupamentos pode 
também fornecer simplificação de dados e até mesmo a 
identificação de relações. Em termos de simplificação de 
dados, segmentação permite que os clientes da HBAT 
sejam categorizados em um segmento que define o ca- 
ráter básico de seus membros. Em uma segmentação 
efetiva, clientes não precisam ser vistos somente como 
indivíduos, mas podem também ser vistos como mem- 
bros de grupos relativamente homogêneos que podem 
ser retratados através de seus perfis em comum. Seg- 
mentos também fornecem uma via para examinar rela- 
ções previamente não estudadas. Um exemplo típico é a 
estimação do impacto de percepções de clientes quanto 
a satisfação para cada segmento, permitindo ao pesqui- 
sador a compreensão sobre o que impacta unicamente 
cada segmento no lugar dos impactos estimados para a 
amostra como um todo. 


Variáveis de agrupamento 

Uma preocupação crítica de qualquer análise de agrupa- 
mentos é o conjunto de variáveis usadas para caracterizar 
objetos. A importância dessa decisão é que as variáveis 
fornecem a base para a definição de similaridade. 


Nesta aplicação, as variáveis potenciais são as 13 per- 
cepções de atributos de HBAT. A partir de usos pré- 
vios em outras técnicas multivariadas (p.ex., regressão 
múltipla e análise discriminante), descobrimos que es- 
sas variáveis fornecem poder preditivo e explanatório 
suficientes para justificar o uso das mesmas como a base 
para segmentação. 

No entanto, a aplicação de análise fatorial (ver Capí- 
tulo 3) identificou três variáveis (X,,, X,; e X,;) que não 
se relacionam com qualquer uma das quatro dimensões 
principais de percepções de HBAT. Assim, essas três 
variáveis não serão usadas na análise de agrupamentos, 
com as demais 10 percepções de atributos formando o 
conjunto de variáveis de agrupamento. 


Estágio 2: Projeto de pesquisa na 
análise de agrupamentos 


Ao preparar uma análise de agrupamentos, o pesquisador 
deve abordar quatro questões no planejamento da pesqui- 
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sa: detecção de observações atípicas, determinação da me- 
dida de similaridade a ser usada, avaliação da adequação 
do tamanho amostral, e padronização das variáveis e/ou 
objetos. Cada um desses pontos tem um papel essencial 
na definição da natureza e do caráter das soluções resul- 
tantes. 


Detecção de observações atípicas 

A primeira questão é identificar quaisquer observações 
atípicas na amostra antes que a partição se inicie. Proce- 
dimentos univariados discutidos no Capítulo 2 não identi- 
ficaram quaisquer candidatos potenciais para designação 
como observações atípicas, mas técnicas multivariadas fo- 
ram consideradas necessárias devido à natureza de análise 
de agrupamentos no uso de todas as variáveis para definir 
similaridade. Assim, a medida Dº de Mahalanobis foi cal- 
culada para cada observação. 

Uma medida multivariada descrevendo a distância de 
cada observação em relação à média da amostra em todas 
as variáveis viabiliza uma comparação de todas as obser- 
vações e a designação de observações atípicas com base 
em um perfil multivariado no conjunto completo de variá- 
veis de agrupamento. 


A Tabela 8-5 contém os valores D” para cada observa- 
ção. Como mostrado, duas observações (24 e 84) apre- 
sentam valores D” substancialmente mais elevados do 
que as demais. Nenhum valor específico de corte designa 
uma observação como atípica, mas valores relativos ex- 
tremamente altos indicam observações que são bastante 
distintas das demais no conjunto de variáveis de agru- 
pamento. Neste caso, essas duas observações (24 e 84) 
não serão eliminadas desta vez, mas elas podem se tor- 
nar candidatas para eliminação em estágios posteriores 
quando pequenos agrupamentos são identificados e de- 
cisões precisam ser tomadas para avaliar se observações 
atípicas surgiram durante o processo de agrupamento. 


Definição de similaridade 

A próxima questão envolve a escolha de uma medida de 
similaridade. Medidas correlacionais não são empregadas, 
pois a derivação de segmentos deve considerar a magnitu- 
de das percepções (favorável versus não favorável), bem 
como o padrão. Tal avaliação é melhor obtida com uma 
medida de similaridade baseada em distância. 


Dado que o conjunto de 10 variáveis é de variáveis mé- 
tricas, a distância euclidiana quadrada é escolhida como 
a medida de semelhança. Se a multicolinearidade fosse 
considerada substancial ou com o efeito de ponderar as 
variáveis de forma desigual, então a distância de Maha- 
lanobis (D”) seria apropriada. 


Tamanho amostral 

A terceira questão é sobre a adequação da amostra de 
100 observações. Esta preocupação não se relaciona aos 
aspectos de natureza estatística, mas sim à habilidade da 
amostra para identificar segmentos administrativamente 
úteis. 


Em nosso caso, a HBAT está interessada somente em 
segmentos que representam pelo menos 10% da popu- 
lação. Segmentos menores são considerados muito pe- 
quenos para justificar o desenvolvimento de programas 
de marketing específicos a segmentos. Assim, em nosso 
exemplo com uma amostra de 100 observações, pode- 
mos esperar que segmentos relevantes sejam compostos 
de 10 observações, mas aceitamos agregados consistindo 
de quantias tão pequenas quanto 5 a 6 observações, a fim 
de explicar variação amostral. Tal número é considerado 
suficiente porque ele permite que segmentos extrema- 
mente pequenos, com até 4 observações, sejam elimina- 
dos sem a preocupação de que eles possam realmente 
ser relevantes para estudos posteriores. 


Padronização 

O ponto final envolve os tipos de padronização que po- 
dem ser usados. Não se considera útil o emprego de pa- 
dronização interna, pois a magnitude das percepções é 
um elemento importante dos objetivos de segmentação, 
e a questão de padronização por variável ainda perma- 
nece. 


Como todas as variáveis de agrupamento são medidas na 
mesma escala (0 a 10), elas não precisam ser padroniza- 
das. As variáveis têm, porém, variados níveis de disper- 
são (ver desvios padrão na Tabela 8-6) que podem afetar 
o processo de agrupamento. Além disso, as médias va- 
riam muito, o que não afeta o processo real em si, mas 
complica comparações entre agrupamentos. Logo, para 
remover qualquer impacto devido a diferentes níveis de 
dispersão, as variáveis serão convertidas para escores Z 
e os valores padronizados serão utilizados na análise de 
agrupamentos. 


Estágio 3: Suposições na análise 
de agrupamentos 


Ao atender às suposições da análise de agrupamentos, o 
pesquisador não está interessado nas qualidades estatísti- 
cas dos dados (p.ex., normalidade, linearidade etc.), mas 
está concentrado principalmente em questões sobre o de- 
lineamento da pesquisa. As duas questões básicas a serem 
abordadas são a representatividade da amostra e a multi- 
colinearidade entre as variáveis de agrupamento. 
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TABELA 8-6 Padronização das variáveis de agrupamento 


Variável de agrupamento Mínimo Máximo Média Desvio padrão 
X. Qualidade do produto 5,0 10,0 7,810 1,396 
X, Atividades de comércio eletrônico 2,2 5,7 3,672 0,701 
X; Suporte técnico 1,3 8,5 5,365 1,530 
X Solução de reclamação 2,6 7,8 5,442 1,208 
Xo Anúncio 1,9 6,5 4,010 1,127 
X,» Imagem da equipe de venda 2,9 8,2 5,123 1,072 
X,3 Preço competitivo 3,7 9,9 6,974 1,545 
X, Garantia e reclamações 4,1 8,1 6,043 0,820 
Xe Encomenda e cobrança 2,0 6,7 4,278 0,929 
X Velocidade de entrega 1,6 5,5 3,886 0,734 


Representatividade amostral 

Uma exigência-chave no uso de análise de agrupamentos 
para atender a qualquer um dos objetivos discutidos no es- 
tágio 1 é que a amostra seja representativa da população de 
interesse. Seja desenvolvendo uma taxonomia, procurando 
por relações ou simplesmente simplificando dados, os re- 
sultados da análise de agrupamentos não são generalizáveis 
se representatividade não for garantida. O pesquisador não 
deve ignorar este ponto, pois a análise de agrupamentos 
não tem meio algum para determinar se o planejamento de 
pesquisa garante uma amostra representativa. 


A amostra de 100 clientes da HBAT foi obtida por meio 
de um processo de escolha aleatória a partir de toda a 
base de clientela. Todas as questões referentes à coleta de 
dados foram tratadas adequadamente para garantir que a 
amostra é representativa da base de clientela da HBAT. 


Multicolinearidade 

Ainda a ser resolvido está o impacto da multicolinearida- 
de sobre a ponderação implícita dos resultados. Se multi- 
colinearidade está presente entre as variáveis (p.ex., como 
mostrado por uma análise fatorial), a preocupação é no 
sentido de que o que parece ser um conjunto de variá- 
veis separadas é na realidade de medidas correlacionadas. 
Essa questão se torna problemática quando o número de 
variáveis fica desproporcional para um grupo de variáveis 
(fator) versus outro. 


Na discussão anterior sobre seleção de variáveis de agru- 
pamento, as 10 percepções da HBAT escolhidas foram 
aquelas que formaram os quatro fatores obtidos da aná- 
lise fatorial descrita no Capítulo 3. Naquela análise, os 
fatores eram bastante semelhantes em termos de núme- 
ro de variáveis por fator (dois fatores com três variáveis 
e dois fatores com duas). Logo, apesar da multicolineari- 
dade demonstrada entre as variáveis de agrupamento, o 
equilíbrio entre fatores em termos de número de variá- 
veis por fator deve minimizar qualquer ponderação im- 


plícita e seu impacto oculto sobre a análise. Além disso, 
não foi considerada necessária qualquer ação corretiva 
(p.ex., uso de escalas múltiplas representando fatores) 
para a multicolinearidade entre variáveis. 


Emprego de métodos hierárquicos 

e não-hierárquicos 

Ao aplicarmos análise de agrupamentos à amostra de 
100 clientes HBAT, seguimos a abordagem de empregar 
métodos hierárquicos combinados com não-hierárquicos. 
O primeiro passo constitui o estágio de partição, usando 
o procedimento hierárquico para identificar um conjun- 
to preliminar de soluções como base para estabelecer o 
número apropriado de agrupamentos e gerar os pontos 
sementes. Em seguida, no passo 2 usamos procedimen- 
tos não-hierárquicos para refinar a solução, gerando 
agregados usando os pontos sementes a partir da análise 
hierárquica e então caracterizando o perfil e validando 
as soluções finais. Os procedimentos hierárquico e não- 
hierárquico de SPSS são usados nessa análise, apesar de 
resultados comparáveis serem obtidos com qualquer pro- 
grama de agrupamento. 


Passo 1: Análise hierárquica de 

agrupamentos (Estágio 4) 

Neste exemplo usamos a vantagem do procedimento hierár- 
quico de agrupamento de rapidamente examinar uma vasta 
gama de soluções para identificar um conjunto de soluções 
preliminares que serão então analisadas por procedimen- 
tos não-hierárquicos para determinar a solução final. Deste 
modo, nossa ênfase na análise hierárquica será no estágio 4 
(o processo real de agrupamento), deixando os estágios de 
perfil e validação (5 e 6) prioritariamente para o processo 
não-hierárquico. No curso de execução da análise hierár- 
quica, o pesquisador deve executar uma série de tarefas: 


1. Escolher o algoritmo de agrupamento. 
2. Gerar os resultados de agrupamento e verificar a existência 
de agregados unitários ou outros que sejam inadequados. 
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3. Escolher as soluções preliminares pela aplicação das regras 
de parada. 

4. Caracterizar o perfil das variáveis de agrupamento para 
identificar as soluções mais apropriadas. 

5. Definir pontos sementes para a análise não-hierárquica. 


Ao fazer isso, o pesquisador deve tratar de questões 
metodológicas e considerar metas administrativas e de 
agrupamento para obter a solução mais representativa 
para a amostra. Nas seções a seguir discutimos ambos os 
tipos de questões quando abordamos as tarefas listadas. 


Seleção de um algoritmo de agrupamento 

Antes de realmente aplicarmos o procedimento de análi- 
se de agrupamentos, devemos primeiramente perguntar: 
qual algoritmo de agrupamento devemos usar? Combi- 
nado com a medida de similaridade escolhida (distância 
euclidiana quadrada), o algoritmo de agrupamento forne- 
ce os meios para representar a semelhança entre agrupa- 
mentos com múltiplos membros. 


O método de ligação média é escolhido neste exemplo 
como uma concessão aos algoritmos que se sustentam 
em uma única observação (algoritmos de ligação simples 
ou completa) enquanto também geram agregados com 
variação interna pequena. O método de Ward não foi 
usado por conta de sua tendência de gerar agrupamentos 
de mesmo tamanho, e determinar a variação de tamanho 
de agregado na amostra é uma importante consideração 
nesta questão de pesquisa. 


Resultados iniciais de agrupamento 

Com a medida de similaridade e o algoritmo de agru- 
pamento definidos, o pesquisador agora pode aplicar o 
procedimento hierárquico. Ele deve rever os resultados 


dentro do intervalo de soluções a serem consideradas 
e identificar quaisquer agregados que possam ser eli- 
minados devido a tamanho pequeno ou outros motivos 
(observações atípicas, não-representativas etc.). Após a 
revisão, os dados identificados são eliminados e a aná- 
lise é rodada novamente com o conjunto reduzido de 
dados. 

Ao escolher o intervalo de soluções a serem conside- 
radas, é útil levar em conta algumas soluções além do que 
se espera necessário para as soluções finais. Por exemplo, 
se um pesquisador estava usando análise de agrupamen- 
tos para gerar uma solução de cinco ou menos agregados, 
soluções com até 10 agrupamentos podem ser avaliadas 
para melhor compreender o processo de combinação de 
agregados que conduz às soluções de interesse. 


A Tabela 8-7 contém as soluções variando de 2 a 10 
agregados para a análise hierárquica inicial. O intervalo 
de soluções a serem examinadas foi restrito a 10 ou me- 
nos porque o processo de segmentação não incluiria em 
geral mais de seis ou sete segmentos. 

Vendo esses resultados, percebemos que diversos 
dos agrupamentos envolvidos (4, 7,9 e 10) são pequenos 
e estão abaixo do tamanho exigido de cinco, anterior- 
mente definido. Logo, esses quatro agrupamentos, que 
contêm um total de sete observações (7, 24, 44, 84, 87, 
90 e 92), serão eliminados. É interessante observar que 
todas essas observações tinham valores D” de Mahala- 
nobis relativamente mais elevados quando observações 
atípicas estavam sendo avaliadas (ver Tabela 8-5), e as 
duas observações que foram anteriormente identificadas 
como possíveis casos atípicos com os maiores valores D? 
(24 e 84) estão neste conjunto de observações a serem 
eliminadas. 


TABELA 8-7 Tamanhos de agregados para a análise hierárquica inicial 


10 agrupamentos iniciais Soluções” 
Identificação Membros 10 9 8 7 6 5 4 3 2 
1 1,6,8,30,33,34,39,40,41,42,49,50, 22 51 51 51 60 60 60 78 96 
55,63,68,69,70,75,86,95,97,100 
2 2,3,16,23,27,29,45,47,52, 17 17 17 18 18 18 18 
53,58,60,61,79,85,88,94 
3 4,5,11,12,14,17,21,25,26,28,31,935, 29 
37,38,51,54,56,62,65,67,74,77,78, 
80,82,89,91,93,96 
4 7,87,92 3 3 3 3 3 3 4 4 « 
5 9,10,15,18,19,46,48,57,66,73 10 10 16 16 16 18 18 18 
6 13,20,22,43,71,99 6 6 
7 24 1 1 i 
8 32,36,59,64,72,76,81,83,98 9 9 9 9 
9 44,90 2 2 2 2 2 
10 84 1 1 1 1 1 1 


Os valores nas células são número de observações em agrupamentos para cada solução (p.ex., na solução de 10 agrupamentos, o agregado 1 tem 22 obser- 
vações e se une com o agregado 3 na solução de 9 agrupamentos para uma alocação combinada de 51 observações). 
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Resultados reespecificados 

A eliminação de sete observações requer que a análise de 
agrupamentos seja novamente executada sobre as 93 ob- 
servações remanescentes. O processo de exame de tama- 
nhos de agregados, identificando potenciais eliminações e 
então retratando o processo de agrupamento, será discu- 
tido na próxima seção. 


Avaliação de tamanhos de agrupamentos. O processo 
prossegue como antes, com os resultados reespecificados 
também examinados quanto a tamanhos inadequados de 
agrupamentos. Agregados abaixo dos tamanhos conside- 
rados administrativamente significantes são candidatos à 
eliminação. Espera-se que observações atípicas já sejam 
identificadas antes da reespecificação, mas o pesquisador 
pode considerar agregados adicionais de um só elemento ou 
aqueles extremamente pequenos também como observa- 
ções atípicas que podem ser omitidas em análise posterior. 

Pesquisadores devem cuidar, porém, para não caírem 
em “looping” com a contínua eliminação de pequenos 
agregados para então reespecificarem a análise de agru- 
pamentos. Deve ser usado discernimento para aceitar um 
pequeno agrupamento e mantê-lo na análise em algum 
ponto; caso contrário, o processo pode começar a eliminar 
segmentos pequenos mas representativos. Os agregados 
pequenos mais problemáticos a serem mantidos são aque- 
les que não se unem a não ser muito adiante no proces- 
so. Pequenos agregados surgidos nos maiores intervalos 
de soluções consideradas podem ser mantidos, pois eles 
ocorrem somente em soluções que não são fortemente 
consideradas para possível seleção. 


As soluções de 10 a 2 agregados da análise hierárquica 
reespecificada são mostradas na Tabela 8-8. Reespecifi- 
cando e eliminando sete observações, o número de agre- 
gados pequenos caiu substancialmente, com somente 


três agrupamentos (2, 4 e 10) tendo quatro observações 
ou menos. 

Ainda que tais agregados sejam muito pequenos para 
representar segmentos viáveis, eles não foram eliminados 
neste estágio por diversas razões. Para os agregados 2 e 
4, estes agrupamentos combinaram nas primeiras soluções 
de agrupamento (nove e oito) de forma que eles não afe- 
tam as soluções esperadas de seis ou menos. Para o agre- 
gado 10, este juntou-se na solução de seis agrupamentos, 
de maneira que afetaria os resultados se uma solução de 
sete agrupamentos fosse escolhida. Se a solução de sete 
agrupamentos é escolhida com este agregado pequeno, ele 
será considerado um segmento pequeno mas relevante. 


Descrição do processo de agrupamento. Com as solu- 
ções consideradas como contendo agregados de tamanhos 
apropriados, prosseguimos examinando o real processo de 
agrupamento por meio (1) do coeficiente de aglomeração 
e do esquema de agrupamento e (2) do dendrograma. 


Esquema de agrupamento. Examinemos primeira- 
mente o esquema de agrupamento produzido por SPSS 
(ver Tabela 8-9). Os cinco elementos descrevendo cada 
estágio de agrupamento são: 


e Estágio: O passo no processo de agrupamento onde os dois 
agregados mais parecidos são combinados. Um processo 
hierárquico sempre envolve N —1 estágios, onde N é o nú- 
mero de observações sendo agregadas. 

e Agrupamentos combinados: Informação detalhando quais 
são os dois agregados que estão sendo combinados em cada 
estágio. 

e Coeficiente de aglomeração: Uma medida do aumento* em 
heterogeneidade que ocorre quando os dois agrupamentos 


*N. de R. T.: A frase correta seria “Uma medida de heterogeneida- 
de”. A análise de valores consecutivos deste coeficiente permitirá a 
verificação de aumentos. 


TABELA 8-8 Tamanhos de agregados para a análise hierárquica de agrupamento reespecificada 


10 agrupamentos iniciais Soluções” 
Identificação Membros 10 9 8 7 6 5 4 3 2 

1 1,6,8,30,33,34,39,41,42,49,50, 21 22 22 22 22 51 51 60 77 
55,63,68,69,70,75,86,95,97,100 

2 40 1 

3 2,16,23,27,29,45,47,52, 13 13 17 17 17 17 17 17 
53,60,61,85,88 

4 3,58,79,94 4 4 

5 4,12,21,31,35,51,54,62,65,80 10 10 10 29 29 

6 5,11,14,17,25,26,28,37,38,56,67, 19 19 19 
74,77,78,82,89,91,93,96 

7 9,10,15,18,19,46,48,57,66,73 10 10 10 10 10 10 16 16 16 

8 13,20,22,43,71,99 6 6 6 6 6 6 

9 32,36,64,72,83,98 6 6 6 6 9 9 9 

10 59,76,81 3 3 3 3 


“Valores nas células são número de observações em agrupamentos para cada solução (p.ex., na solução de 10 agrupamentos, o agregado 1 
tem 21 observações e se une ao agregado 2 na solução de 9 agrupamentos para uma alocação combinada de 22 observações). 
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são combinados. Para a maioria dos métodos de ligação, o 
coeficiente de aglomeração é a distância entre os dois casos 
de agrupamentos sendo combinados. 

e Estágio em que o agrupamento surge pela primeira vez: 
Identifica o estágio anterior no qual cada agrupamento sen- 
do combinado foi envolvido. Valores nulos indicam que o 
agrupamento ainda é de um elemento só, e não combinado 
antes daquele estágio. 

e Próximo estágio em que novo agrupamento surge: Denota 
o próximo estágio no qual o novo agregado é combinado 
com outro. 


Examinemos dois estágios (1 e 84) da Tabela 8-9 para 
ilustrar o que o esquema de agrupamento retrata no pro- 
cesso aglomerativo: 


e Estágio 1: Aqui vemos que os agrupamentos 23 e 29 são 
os primeiros dois grupos a se unirem, com um coeficien- 
te de aglomeração de 0,719. Sabemos que eles são agru- 
pamentos unitários porque a coluna "Estágio em que 
o agrupamento surge pela primeira vez" indica estágio 
0, o que significa que eles não foram agregados antes. 
Finalmente, o agrupamento formado neste estágio é 
combinado novamente no estágio 7. 

e Estágio 84: Neste, os agrupamentos 1 e 8 são unidos 
com um coeficiente de aglomeração de 12,439. Podemos 
perceber que o agrupamento 1 foi inicialmente formado 
no estágio 76, enquanto que o agregado 8 é um agru- 
pamento unitário com um valor de zero (ver discussão 
anterior). Finalmente, podemos ver que este agrupa- 


mento combina a seguir no estágio 88, onde é chamado 
de agregado 1. 


A informação do esquema de agrupamento descreve 
completamente o processo, permitindo ao pesquisador se- 
guir qualquer observação isolada ou agregado por todo o 
processo. Também fornece informação diagnóstica, como 
a habilidade de rapidamente identificar agrupamentos 
unitários (ou seja, um zero na coluna “Estágio em que o 
agrupamento surge pela primeira vez”). 


A Tabela 8-9 contém o esquema detalhado de agrupa- 
mento para a análise hierárquica reespecificada. Aqui 
percebemos os estágios iniciais e finais, com os interme- 
diários omitidos para fins de concisão. 

Quando examinamos os estágios iniciais, percebe- 
mos que a maior parte da atividade está centrada na 
união de agrupamentos unitários, como é de se esperar. 
No entanto, vemos em dois casos (estágios 7 e 9) que 
agrupamentos formados em estágios anteriores já estão 
sendo unidos com outros agregados. Nos estágios finais 
vemos o padrão de agrupamento já retratado na Tabela 
8-8. Por exemplo, o estágio 84 corresponde à combina- 
ção de agregados (agrupamentos 1 e 2 combinando) que 
ocorre indo da solução de 10 agrupamentos para a de 9 
na Tabela 8-8. Vemos a presença do agregado unitário 


(Continua) 


TABELA 8-9 Coeficiente de aglomeração e esquema de agrupamento para análise hierárquica reespecificada 


Agrupamentos combinados Coeficiente de 


Estágio em que o agrupamento 


auge pela primeira ves Próximo estágio no qual 


Estágio Agrupamento 1 Agrupamento 2 aglomeração Agrupamento 1 Agrupamento 2 novo agrupamento surge 
1 23 29 0,719 0 0 7 
2 72 76 1,023 0 0 28 
3 36 39 1,256 0 0 47 
4 41 64 1,414 0 0 9 
5 16 19 1,484 0 0 33 
6 65 67 1,526 0 0 15 
7 23 31 1,574 1 0 23 
8 3 17 1,746 0 0 17 
9 41 42 1,901 4 0 18 
10 89 92 2,179 0 0 34 

Estágios intermediários de 11 a 83 omitidos 
84 1 8 12,439 76 0 88 
85 23 24 13,389 80 47 91 
86 40 41 13,759 78 81 88 
87 89 91 14,877 83 1 90 
88 1 40 15,068 84 86 90 
89 72 82 16,451 79 82 92 
90 1 89 18,210 88 87 91 
91 1 23 19,209 90 85 92 
92 1 72 23,098 91 89 0 
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(Continuação) 

(2 na Tabela 8-8) representado pelo zero na coluna “Es- 
tágio em que o agrupamento surge pela primeira vez”. 
Em todos os demais estágios, os dois agrupamentos 
sendo combinados já são um resultado de combinações 
prévias, de forma que nenhum outro agregado unitário 
existe. Esta condição pode ser confirmada revendo-se a 
Tabela 8-8. 


Dendrograma. O dendrograma fornece um retra- 
to gráfico do processo de agrupamento. A estrutura em 
árvore do dendrograma retrata cada estágio do processo. 
Tipicamente o gráfico é escalonado, de maneira que dis- 
tâncias menores entre combinações indicam maior homo- 
geneidade. 


A Figura 8-11 é o dendrograma para a análise hierárqui- 
ca reespecificada de 93 observações. Como esperado, o 
agrupamento inicial está entre observações muito simi- 
lares, mas o processo se torna estendido quando o núme- 
ro de agrupamentos diminui. No topo do dendrograma 
podemos ver o agregado de 17 observações (agrupamen- 
tos3 e 4na Tabela 8-8) e na base está o agrupamento de 
16 observações (agrupamentos 7 e 8 na Tabela 8-8). O 
meio do dendrograma, que em última instância forma o 
agregado de 60 observações na solução de três agrupa- 
mentos, retrata a formação dos demais agregados, o que 
envolve muito mais complexidade e menos distinção. 

O processo de agrupamento pode ser examinado co- 
meçando no nível individual e agregando no sentido de 
um número menor de agregados, ou indo ao contrário, 
começando no último estágio (onde os dois últimos agre- 
gados são combinados) e compreendendo como cada um 
daqueles agregados foi formado. Por exemplo, olhando 
o topo do dendrograma percebemos o agrupamento de 
17 observações, que é bastante distinto (o topo do den- 
drograma). Olhando para trás aqui, podemos ver como 
essas 17 observações foram combinadas. O dendrogra- 
ma também permite uma inspeção visual quanto a possí- 
veis observações atípicas, onde uma delas seria um ramo 
que não se uniu a não ser muito tarde. Um exemplo é o 
último caso no dendrograma (84), no qual esta informa- 
ção não é juntada até uma fase avançada no processo 
aglomerativo. 


Determinação das soluções 

preliminares de agrupamento 

Até este ponto, detalhamos os aspectos do processo de 
agrupamento, ainda que não tenhamos tratado desta 
questão fundamental: qual é a solução final? Devemos no- 


tar que na maioria das situações, uma única solução final 
não será identificada na análise hierárquica. Em vez disso, 
um conjunto de soluções preliminares é identificado. Tais 
soluções formam a base para a análise não-hierárquica, 
a partir da qual uma solução final é selecionada. Mesmo 
que uma solução final não seja reconhecida neste estágio, 
o pesquisador deve executar duas análises-chave para 
identificar o melhor conjunto de soluções preliminares: 


1. Aplicar a regra de parada para reconhecer um pequeno nú- 
mero de soluções para consideração posterior. 

2. Examinar os perfis de cada solução sobre as variáveis de 
agrupamento para estabelecer a relevância de cada agrupa- 
mento para a questão de pesquisa. 


Essas análises fornecem uma descrição mais detalhada 
dos agregados em cada solução e como eles se relacionam 
à questão de pesquisa. Contudo, mesmo com ambas, o jul- 
gamento do pesquisador se torna o fator mais importante 
na escolha da solução final que pode melhor tratar a ques- 
tão de pesquisa. 


Aplicação das regras de parada. Quantos agregados de- 
vemos ter? Como os dados envolvem perfis de clientes 
HBAT e nosso interesse reside na identificação de tipos 
ou perfis desses clientes que podem formar a base para di- 
ferentes estratégias, um número administrável de segmen- 
tos, sob uma perspectiva estratégica e tática, seria algo que 
não seja acima de seis ou sete. Logo, aplicamos a regra da 
parada com base na avaliação da variação de heterogenei- 
dade entre soluções para identificar um conjunto prelimi- 
nar de soluções de agrupamento. O foco está nas soluções 
que variam de 10 a 2 agregados, com o objetivo de escolher 
uma ou mais soluções no intervalo de 2 a 7 agregados. 


Variações percentuais em heterogeneidade. Aregra 
da parada é baseada na avaliação de variações de hetero- 
geneidade entre soluções de agrupamentos. O raciocínio 
básico é que quando ocorrem grandes aumentos de he- 
terogeneidade, o pesquisador escolhe a solução anterior, 
pois a combinação une agrupamentos muito diferentes. 

O coeficiente de aglomeração é particularmente tratá- 
vel para uso em uma regra de parada. Pequenos coeficien- 
tes indicam que agrupamentos bem homogêneos estão 
sendo fundidos. Em contrapartida, reunir dois agregados 
diferentes resulta em um grande coeficiente. Cada combi- 
nação de agrupamentos resulta em heterogeneidade cres- 
cente, de modo que nos concentramos em grandes varia- 
ções percentuais no coeficiente, semelhante ao teste scree 
em análise fatorial, para identificar estágios de combina- 
ção de agrupamentos que sejam sensivelmente distintos. 
O único porém é que esta abordagem, a despeito de ser 
um algoritmo bastante preciso, tende a indicar pouquíssi- 
mos agrupamentos. 
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FIGURA 8-11 Dendrograma de análise hierárquica de agrupamento reespecificada. 
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O coeficiente de aglomeração mostra grandes aumentos 
quando se passa dos estágios 88 para 89 (15,068 versus 
16,451), 89 para 90 (16,451 versus 18,210) e 91 para 92 
(19,209 versus 23,098). Para ajudar a quantificar grandes 
aumentos relativos na heterogeneidade dos agrupamen- 
tos, calculamos a mudança percentual no coeficiente de 
agrupamento para os estágios incluindo 10 a 1 agrupa- 
mentos (ver Tabela 8-10). O maior aumento percentual 
ocorre na passagem entre os estágios 91 e 92, seguido 
pelos estágios 89 a 90 e 88 a 89. 

No entanto, o que significa a seleção de uma solu- 
ção de agrupamento? Consideremos o maior aumento 
(estágios 91 versus 92) como exemplo. O coeficiente de 
aglomeração para o estágio 92 é de 23,098, que repre- 
senta a heterogeneidade quando os dois agrupamentos 
finais são unidos em um só agregado. Como geralmente 
é encontrado, este é um coeficiente bastante elevado. 
O estágio 91 representa a passagem de três para dois 
agrupamentos, com um coeficiente de 19,209. Quando 
comparamos os coeficientes de aglomeração desses dois 
estágios, percebemos que o coeficiente aumenta em 
20,25% do estágio 91 para o 92. Isso indica que a cria- 
ção da solução de dois agrupamentos (passando de três 
para dois agregados) resulta em sensivelmente menos 
heterogeneidade do que no estágio final para criação 
de um só agrupamento. Desse modo, consideramos a 
configuração de dois agrupamentos como uma solução 
potencial. 

Seguindo esta lógica, identificamos as soluções de 
dois, quatro e cinco agrupamentos como candidatas 
para o conjunto preliminar de soluções a serem exa- 
minadas posteriormente pela análise não-hierárquica. 
No entanto, deve ser notado que o aumento na hete- 
rogeneidade no estágio final (aqui, dois agrupamentos 
são unidos para formar um) sempre será grande. Ou 
seja, a solução de dois agrupamentos será, em geral, 
sempre identificada através desse procedimento, ainda 


TABELA 8-10 Regra de parada para a análise hierárqui 


que possa representar valor limitado no atendimento 
a muitos objetivos de pesquisa. Pesquisadores devem 
evitar a tentação de dizer que a solução de dois agru- 
pamentos é a melhor por envolver a maior variação em 
heterogeneidade. Para este fim, selecionamos a solução 
de três agrupamentos como uma das soluções prelimi- 
nares, pois ela é parecida com a de dois agrupamentos, 
mas fornece alguma visão sobre a estrutura básica além 
dos dois grupos. 

Apesar de também podermos examinar as outras 
soluções, escolhemos somente as de cinco e seis agru- 
pamentos por diversas razões. A solução de cinco agru- 
pamentos representa a maior solução indicada pela 
regra da parada. Mas também examinamos a de seis 
agrupamentos para garantir que uma solução maior 
não fornece uma solução melhor em termos de grupos 
de clientes. 


A regra da parada identificou três soluções (com cinco, 
quatro e dois agrupamentos) como candidatas para o con- 
junto preliminar de soluções a serem consideradas na aná- 
lise não-hierárquica. A solução de cinco agrupamentos foi 
selecionada e a de três agregados foi a substituta para a de 
duas, para fornecer o nível mínimo de visão exigida sobre 
o cliente. A solução de seis agrupamentos também foi in- 
cluída para garantir que nenhuma visão adicional é con- 
seguida a partir de mais do que cinco grupos de clientes. 
Essas três soluções são agora examinadas em termos do 
grau e tipos de diferenças entre agregados para finalizar 
as soluções utilizadas nos próximos estágios da análise de 
agrupamentos. 


Perfil das variáveis de agrupamento. Antes de proceder 
com a análise não-hierárquica, fazemos o perfil de cada 
solução sobre as variáveis de agrupamento para garantir 
que cada solução seja distinta e que as diferenças entre 
agrupamentos sejam significantes sob a ótica da questão 
de pesquisa. 


ca de agrupamentos reespecificada 


PROCESSO HIERÁRQUICO 


REGRA DE PARADA 


Coeficiente de aglomeração 


Número de agrupamentos 


Aumento percentual 


Estágio Antes de unir Depois de unir Valor para o próximo estágio 

84 10 9 12,439 7,64 
85 9 8 13,389 2,76 
86 8 7 13,759 8,13 
87 7 6 14,877 1,23 
88 6 5 15,068 9,18 
89 5 4 16,451 10,69 
90 4 3 18,210 5,49 
91 3 2 19,209 20,25 
92 2 1 23,098 = 
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A Figura 8-12 fornece uma análise de perfil das três so- A mudança da solução de seis agregados para a de 
luções de agrupamento baseadas nas 10 variáveis. Ao se cinco é conseguida ao se unir os agrupamentos 1 e 
compararem soluções, dois pontos surgem: 3 na solução de seis agregados (porção superior da 


Figura 8-12). O agrupamento resultante (1 na solu- 
ção de cinco agregados) difere sobre apenas duas va- 
riáveis (X, e X,,) que constituem o fator de Suporte 
Técnico formado no Capítulo 3. Ao longo de sete das 
oito variáveis remanescentes, esses dois agrupamen- 
tos são bastante semelhantes, com apenas pequenas 
diferenças sobre X.. Assim, a solução de seis agrupa- 
mentos difere da de cinco somente no sentido de que 
dois agregados se diferenciam em termos de Suporte 
Técnico. Tais diferenças podem não ser considera- 


1. A solução de três grupos é claramente distinta das 
de cinco e seis agregados, fornecendo uma solução 
alternativa viável para comparação no processo 
não-hierárquico. Cada um dos três agrupamentos é 
relativamente distinto e varia em magnitude sobre 
as variáveis. O padrão de um agrupamento sendo 
elevado em todas as variáveis, outro baixo nas mes- 
mas e um terceiro no meio termo é evitado. 

2. Não obstante, as diferenças são muito menos distin- 
tas entre as soluções com seis e cinco agrupamentos. 


(Continua) 
Solução de seis agrupamentos = 
3 Variável de | Centróides para a solução de seis agrupamentos 
agrupamento 
a Agrupamento 
e) -=-1 
g 
N 
[am 
o ---2 
Ko) 
a 
o 3 
o 
ô 4 
Li 
---"5 
— 6 
=a ] T T T T T T T 
Xo Xg Xe X Xo Xp Xa Xa X Xg 
Variáveis de agrupamento Tamanho 22 17 29 10 6 9 
Nota: Todas as variáveis são estatisticamente significantes no nível 0,000 
Solução de cinco agrupamentos Variável de Centróides para a solução de 
ST—>>—>————— agrupamento cinco agrupamentos 
1 2 3 4 5 
24 Xg -0,319 | 0,895 | 1,099 | 0,627 | —1,046 
fo) PA EA pe Xi8 -0,256 | 0,692 | 1,353 | 0,541 | —1,085 
GS ' Sargietio ds Ra 
E 4d “ º , Xi6 -0,133 | 0,670 | 0,853 | 0,454 | —1,244 
o Pa rá 4 “*% med 
9 X 0,015 |-0,817 | 0,640 | 1,967 | -0,800 
o Xo 0,000 |-0,385 | 0,701 | 1,322 | -3,44 
o 
2 Xp 0,021 |-0,767 | 0,715 | 1,750 | —1,089 
u 
Xg —0,068 | 0,434 | -0,304 |-0,075 | 0,212 
Xi -0,103 | 0,314 |-0,248 | 0,131 | 0,097 
2 Xe —0,056 | 0,621 |-1,210 | 0,900 | 0,637 
] T T T T T T T 
Xo Xe Xe X Xo Xp Xa Xa Xe Xi X3 0,297 |-1,304 | 1,124 | 0,254 | -0,997 
Variáveis de agrupamento Tamanho 51 17 10 6 9 


Nota: Todas as variáveis, exceto X, e X,, são estatisticamente 
significantes no nível 0,000 


FIGURA 8-12 Análise de perfil de variáveis padronizadas para as soluções hierárquicas de seis, cinco e três agrupamentos. (Continua) 
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FIGURA 8-12 Continuação. 


Xia 


Variável de |Centróides para a solução 
agrupamento| de três agrupamentos 
1 2 3 
Xg -0,428 | 0,895 | 0,922 
Ag de ris, Xi8 -0,380 | 0,692 | 1,049 
Ei Xi6 -0,299 | 0,670 | 0,703 
X -0,119 |-0,817 1,137 
: Xi —0,052 |-0,385 | 0,934 
Xi —0,146 |-0,767 1,103 
Xg —0,026 | 0,434 |-0,218 
Xi -0,073 | 0,314 |-0,106 
X6 0,048 | 0,621 | -0,419 
X3 0,103 |-1,304 | 0,798 
Tamanho 60 17 16 


Nota: Todas as variáveis, exceto X, e X,, são 


estatisticamente significantes no nível 0,000 


Nota: Variáveis de agrupamento foram ordenadas nos gráficos e tabelas para corresponderem aos fatores encontrados na solução de quatro 


agrupamentos* (ver Capítulo 3). 


(Continuação) 
das significantes o suficiente para apoiar a inclusão 


de ambas as soluções de cinco e de seis agregados no 
conjunto preliminar de soluções finais. 


Seleção das soluções preliminares. Pode parecer ótimo 
para as regras de parada e para as análises de perfil a iden- 
tificação de somente uma solução de agrupamentos para 
análise posterior no processo não-hierárquico, mas pes- 
quisadores são defrontados mais frequentemente com um 
pequeno conjunto de soluções que vale a pena para con- 
sideração posterior. A meta do pesquisador neste estágio 
é definir o menor conjunto de soluções que representam 
diferentes perspectivas sobre a estrutura inerente e seg- 
mentação das observações. 


Apesar de a regra de parada ser o ponto de partida 
para a identificação de três soluções de agrupamentos 
como candidatas à inclusão na análise não-hierárqui- 
ca, um exame mais próximo por meio do perfil das va- 
riáveis revelou somente limitadas diferenças entre as 
soluções de seis e cinco agrupamentos. Em nossa opi- 
nião, as diferenças não eram grandes o bastante e nem 
variadas no conjunto de variáveis. Para fins de parci- 
mônia, escolhemos a solução de cinco agrupamentos 
com a de três como o conjunto preliminar de soluções 
a ser analisado com mais detalhes pelos procedimen- 
tos não-hierárquicos. 


* N. de R.T.: A frase correta seria “... para corresponderem aos fato- 
res encontrados na solução de quatro fatores (ver Capítulo 3).” 


Resumo do processo hierárquico de agrupamento 
O objetivo da análise hierárquica de agrupamentos foi 
identificar uma solução ou um pequeno número de solu- 
ções que pudessem ser analisadas pelos procedimentos 
hierárquicos** para identificar uma solução final. Neste 
método, capitalizamos os pontos fortes do processo hie- 
rárquico (sua habilidade de avaliar uma grande quantia 
de soluções e facilidade de comparação entre as mes- 
mas) enquanto deixamos a escolha final da(s) melhor(es) 
solução(ões) para os procedimentos não-hierárquicos. 


Em nosso exemplo de segmentação envolvendo os 100 
clientes HBAT, usamos 10 percepções da HBAT como 
as variáveis de agrupamento no processo hierárquico. 
Inspeção inicial dos agregados indicou uma eliminação 
de sete observações representando aquelas que são atí- 
picas ou segmentos muito pequenos para se considerar 
nesta análise. 

A análise reespecificada identificou três soluções 
(com seis, cinco e três agrupamentos) como candida- 
tas para uso no processo hierárquico***. Em seguida, 
o perfil das variáveis de agrupamento indicou uma falta 
de distinção suficiente entre as soluções com seis e cinco 
agrupamentos, de forma que somente as soluções com 
três e cinco agrupamentos foram mantidas no conjunto 
preliminar de soluções a serem usadas na análise não- 
hierárquica que se segue. 


** N. de R. T.: A frase correta seria “... pelos procedimentos não-hie- 
rárquicos”. 
*** N. de R. T.: O correto é “não-hierárquico”. 
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Passo 2: Análise não-hierárquica de 
agrupamentos (Estágios 4, 5 e 6) 


O método hierárquico de agrupamento facilitou uma 
avaliação abrangente de uma vasta gama de soluções. 
Essas soluções são afetadas, porém, por uma caracterís- 
tica em comum: uma vez que agrupamentos são unidos, 
eles jamais são separados no processo. Selecionamos um 
algoritmo hierárquico que minimiza o impacto dessa ca- 
racterística, mas métodos não-hierárquicos ainda detêm a 
vantagem de serem capazes de otimizar as soluções pela 
redesignação de observações até que seja conseguida uma 
heterogeneidade mínima dentro dos conglomerados. 

Este segundo passo no processo de agrupamento uti- 
liza métodos hierárquicos em combinação com os proce- 
dimentos não-hierárquicos. Especificamente, o número 
de agrupamentos e os pontos sementes para cada agrupa- 
mento são determinados a partir de resultados hierárqui- 
cos. Em seguida empregamos os procedimentos não-hie- 
rárquicos para o desenvolvimento de uma solução ótima 
para cada número de agregados. Tais soluções são então 
comparadas em termos de validade de critério, bem como 
de aplicabilidade à questão de pesquisa para se escolher 
uma solução como a final. 


Estágio 4: Determinação de agrupamentos 

e avaliação do ajuste geral 

O principal elemento do segundo passo é o emprego de 
técnicas não-hierárquicas para melhorar os resultados a 
partir dos procedimentos hierárquicos. Ao executar uma 
análise não-hierárquica, um pesquisador deve tomar duas 
decisões: 


1. Como serão gerados os pontos sementes para os agrupa- 
mentos? 
2. Qual algoritmo de agrupamento será utilizado? 


A discussão a seguir trata desses dois pontos em rela- 
ção ao uso de resultados hierárquicos no procedimento 
não-hierárquico. 


Especificação de pontos sementes de agrupamento. A 
primeira tarefa em análise de agrupamentos não-hierár- 
quica é a seleção do método para especificação de pontos 
sementes, o ponto inicial para cada agrupamento. A partir 
disso, o algoritmo designa observações e forma agregados. 
Dois métodos para escolha de sementes são geração por 
amostragem (ou seja, seleção ao acaso) e especificação 
pelo pesquisador. Os métodos de geração por amostra- 
gem, apesar de operacionalmente simples, sofrem de uma 
falta de teoria inerente na formação de agrupamentos. 
Além disso, eles são difíceis de replicação ao longo das 
amostras. Em contrapartida, a abordagem via especifica- 
ção do pesquisador exige alguma base conceitual ou em- 
pírica para as sementes. Apesar de ela demandar análise 
adicional ou pesquisa anterior para especificação dos pon- 


tos sementes, a abordagem via pesquisador é geralmente 
a opção preferida por conta da estrutura que ela impõe 
sobre o processo não-hierárquico. 

A abordagem mais comum para derivação de centrói- 
des especificados pelo pesquisador é usar a solução hie- 
rárquica, seja pela seleção de uma observação de cada 
agrupamento para representar o mesmo, seja, como é 
mais comum, pelo uso dos centróides como pontos se- 
mente. Deve ser observado que tipicamente a obtenção 
de centróides demanda análise adicional para a seleção 
de soluções a serem usadas na análise não-hierárquica e 
para derivar os centróides a partir do perfil de cada solu- 
ção. Esses perfis não são tipicamente gerados na análise 
hierárquica; fazer isso iria exigir tremendo esforço, pois a 
geração de N —1 soluções e a obtenção de um perfil para 
cada uma delas seria ineficiente. 


O processo de agrupamento hierárquico é usado para ge- 
rar os pontos sementes. Como discutido na seção anterior, 
as soluções de três e cinco agrupamentos foram determi- 
nadas como soluções que seriam posteriormente analisa- 
das por meio dos procedimentos não-hierárquicos. 

Todas as 10 variáveis serão usadas na análise não- 
hierárquica: assim, os pontos sementes demandam valo- 
res iniciais sobre cada variável para cada agrupamento. 
Os centróides mostrados nas tabelas da Figura 8-12 atu- 
arão como pontos sementes para ambas as soluções. Por 
exemplo, na solução de cinco agrupamentos, os valores 
na tabela representam os centróides para cada um dos 
cinco agrupamentos ao longo das 10 variáveis. Analoga- 
mente, centróides para a solução de três agrupamentos 
são também dados na tabela inferior. 


Seleção de um algoritmo de agrupamento. Com as se- 
mentes especificadas, o pesquisador deve então escolher 
o algoritmo a ser usado para formar agrupamentos. Um 
benefício básico de métodos não-hierárquicos é a habili- 
dade de formar uma solução completamente separada de 
qualquer outra. Tal procedimento está em contraste com 
métodos hierárquicos, nos quais qualquer solução é dire- 
tamente baseada na combinação de dois agrupamentos da 
solução anterior. Desse modo, métodos não-hierárquicos 
são geralmente preferidos quando possível, pois eles ti- 
picamente melhoram uma solução existente desenvolvida 
durante um processo hierárquico. 


Para nossos propósitos, usamos o algoritmo de otimiza- 
ção em SPSS, o qual permite a designação de observa- 
ções entre agrupamentos de forma iterativa, até que um 
nível mínimo de heterogeneidade seja alcançado. Em 
nosso exemplo, observações são inicialmente agrupadas 


para a semente mais próxima. Quando todas as observa- 
(Continua) 


472. Análise Multivariada de Dados 


(Continuação) 
ções são designadas, cada uma delas é avaliada para ver 


se ainda está no agrupamento mais próximo. Caso con- 
trário, ela é redesignada a um agregado mais próximo. O 
processo continua até que a heterogeneidade nos agru- 
pamentos não possa diminuir com novas movimentações 
de observações entre os agregados. 


Formação de agrupamentos. Com as sementes de agru- 
pamento e o algoritmo especificados, o processo pode 
iniciar. Com um algoritmo de otimização, o processo con- 
tinua a redesignar observações até que uma nova designa- 
ção não melhore a homogeneidade interna. 


Usando os centróides dos resultados hierárquicos de 
agrupamento, o procedimento não-hierárquico gerou as 
soluções de três e cinco agregados mostradas na Figura 
8-13. Duas diferenças entre as soluções hierárquicas e 
não-hierárquicas são notáveis: 


e Tamanhos dos agrupamentos. As soluções não-hierár- 
quicas, talvez por conta da habilidade de redesignar ob- 
servações entre agrupamentos, têm uma dispersão mais 
uniforme de observações entre os agrupamentos. Como 
exemplo, a solução de três agrupamentos da análise 
hierárquica tem agrupamentos de 60, 17 e 16 observa- 
ções. Em contrapartida, a análise não-hierárquica re- 
sultou em agrupamentos de 39, 28 e 26 observações. A 
despeito de agrupamentos de tamanhos relativamente 
parecidos não ser um critério para sucesso, eles são uma 
indicação de que o processo hierárquico pode ter res- 
tringido os resultados pelo impedimento de observações 
trocarem de agrupamentos, uma vez unidas. 

e Significância de diferença de variáveis. Outra diferença 
fundamental entre as duas soluções é a habilidade do 
processo não-hierárquico de delinear agrupamentos 
que são mais distintos do que as soluções hierárquicas. 
Nas soluções de cinco e três agrupamentos, as variáveis 
X,e X, não eram significativamente distintas ao longo 
dos agregados. Observe que essas duas variáveis eram 
as diferenças de distinção entre os agrupamentos unidos 
para formar a solução de cinco agregados. Parece que 
a falta de capacidade do processo hierárquico para re- 
designar observações entre agrupamentos resultou em 
agrupamentos que explicam menos variação do que as 
contrapartes não-hierárquicas. 


Resumo. O processo não-hierárquico de agrupamento 
gerou soluções de três e cinco agregados baseadas nos 
pontos semente gerados pela análise de agrupamento hie- 
rárquica. Ainda que o número de agrupamentos seja simi- 
lar, as soluções variam entre os dois métodos. As soluções 
não-hierárquicas foram mais semelhantes em tamanho e 
demonstraram diferenças mais significantes entre agrupa- 
mentos sobre o conjunto de variáveis. Análise subsequen- 
te em termos de perfil dessas duas soluções e avaliação da 
validade de critério das mesmas fornecerá os elementos 
necessários para selecionar uma solução final. 


Estágio 5: Interpretação dos agrupamentos 
Com o processo não-hierárquico completo, o pesquisador 
deve agora avaliar as duas soluções competidoras e esco- 
lher uma como a solução final de agrupamento a ser usada 
para fins de segmentação. No entanto, antes de estabele- 
cer o perfil de cada solução ou de avaliar a validade de 
critério das mesmas, o pesquisador deve definir o caráter 
de cada agrupamento em termos da variável estatística 
(variáveis de agrupamento). Fazendo isso, o pesquisador 
fornece uma fundamentação para compreender a habili- 
dade de cada solução em atender aos objetivos da questão 
de pesquisa, bem como avalia sua correspondência com 
quaisquer agrupamentos sugeridos por teoria ou por pes- 
quisa anterior. No estágio 4, examinamos os agrupamentos 
quanto a distinção, mas aqui consideramos a significância 
prática dos agrupamentos no atendimento dos objetivos 
de segmentação de mercado. Qual é a melhor segmenta- 
ção de mercado — com cinco segmentos ou com três? 

Para os propósitos deste exemplo, ênfase será coloca- 
da na descrição de cada agrupamento em termos da variá- 
vel estatística. 


Os resultados para as soluções de cinco e de três agru- 
pamentos são mostrados na Figura 8-13. Ao avaliar os 
perfis sobre as variáveis de agrupamento, devemos lem- 
brar de alguns dos resultados da análise fatorial execu- 
tada sobre essas 10 variáveis (ver Capítulo 3). Os quatro 
fatores, definidos como dimensões de variáveis que são 
altamente correlacionadas, são: Serviço de Pós-Venda 
ao Consumidor (X,, X,; e X,) : Marketing (X,,, X, e 
X,): Suporte Técnico (X, e X,,) e Valor do Produto (X, 
e X,). Assim, agrupamentos devem ter um padrão se- 
melhante nas variáveis em cada fator, mas espera-se que 
padrões de diferenças apareçam entre fatores.” 
Vendo as duas soluções, diversos pontos surgem: 


e Variação substancial na variável estatística inteira. 

Nas soluções de três e cinco agrupamentos, os perfis 
mostram sensíveis diferenças em cada variável de agru- 
pamento. Esses perfis contrastam com os resultados 
hierárquicos, onde diferenças eram muito pequenas 
sobre diversas variáveis. Diferenças maiores sobre cada 
variável fazem de cada uma delas uma contribuidora 
potencial para diferenças entre agrupamentos. 

e Perfis distintos. Além de diferenças sobre cada variável, 
também percebemos que os perfis de cada agrupamen- 
to são mais distintos, particularmente na solução de 
três agrupamentos, onde os três são diferentes uns dos 
outros no intervalo inteiro da variável estatística. Nova- 
mente, essa distinção acrescenta significância prática no 
sentido de que cada segmento tem um perfil distinto que 
pode ser tratado em uma estratégia de segmentação. 

A questão é: qual solução de agrupamento é melhor? 

Cada uma tem suas vantagens e desvantagens. A de cinco 

agrupamentos oferece maior diferenciação entre agru- 
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* N. de R. T.: A frase correta seria “... apareçam entre os agrupa- 
mentos.” 
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Solução de cinco agrupamentos 


20 Variável de Centróides para a solução 
: agrupamento de cinco agrupamentos 
1,5] N a 1 2 3 4 5 
: gs Ms Xg H0,416 | 0,880 | 0,811 | 0,151 |-0,704 
S ts, Dow Agiapemeto Xa [0,295 |0,720 | 1,079 | 0,064 |-0,741 
g Ss 
E Xi6 H-0,262 | 0,670 | 0,754 | 0,203 |-0,654 
g is X 0,293 |0,624 | 0,529 | 1,444 |-0,400 
s 3 Xo 0,230 |H0,506 | 0,441 | 0,849 |-0,260 
ê =Esiá! Xi 0,257 |-0,651 | 0,518 | 1,432 |-0,402 
—s5 Xg H0,872 | 0,490 |-0,131 |0,081 | 0,641 
+“ 0+ “4 
10 Xi4 H1,039 | 0,399 |-0,113 |0,012 | 0,705 
1,5 Xe 0,068 | 0,566 |-1,255 | 0,584 | 0,184 
XX Xe X Xo Xo Xa Xa XX Xis 0,309 -1,106 | 0,775 | 0,216 |-0,069 
Variáveis de agrupamento Tamanho 29 20 14 16 24 
Nota: Todas as variáveis de agrupamento são significativamente 
distintas no nível de significância de 0,000 
Solução de três agrupamentos 
ts Variável de |Solução de três agrupamentos 
1,04 
(e) pesa is Agrupamento 
E 0,54) / o -=-1 
e ) r À] 
o , a x ! 1 4 = 2 
o 0,0 =, id bas 1 a 
o 1 Pá sa Ed y 
o x Y e 3 
o Re ” 1º / N 
O -051).--- Neco ra , 
Pr [ Sd ds r 
1,0 ” 
1,5 T T T T T T T T 
XX Xe X Xo Xo Xa Xa Xo Xg 
Variáveis de agrupamento 


Nota: Todas as variáveis de agrupamento são significativamente 
distintas no nível de significância de 0,000 


FIGURA 8-13 Soluções não-hierárquicas”: com cinco e três agrupamentos com análise de perfis de variáveis de agrupamento padronizadas. 


Nota: Variáveis de agrupamento foram ordenadas nos gráficos e nas tabelas para corresponderem aos agregados encontrados na solução de quatro 


agrupamentos” (ver Capítulo 3). 


Pontos sementes iniciais foram fornecidos pelos centróides a partir da análise hierárquica de agrupamentos. 


(Continuação) . 
pamentos; cada um deles representa um conjunto menor 


e mais homogêneo de clientes. No entanto, esses perfis 
verdadeiramente representam diferenças significativas? 
Ou a solução mais parcimoniosa de três agrupamentos, 
com maiores diferenças entre menos agrupamentos, é a 
mais útil? 


Tais comparações são apenas descritivas e oferecem 
uma visão sobre o caráter de cada agrupamento. Apesar 


* N. de R. T.: A frase correta seria “... na solução de quatro fatores...”. 


de as comparações serem úteis na caracterização de cada 
agrupamento, a próxima seção tenta distinguir as duas so- 
luções em termos de validade de critério ou de seus perfis 
associados a fim de designar uma das soluções como a fi- 
nal a ser usada para fins de segmentação. 


Estágio 6: Validação e perfil dos agrupamentos 
Nesse estágio final, os processos de validação e de per- 
fil são críticos devido ao aspecto exploratório e muitas 


vezes sem base teórica da análise de agrupamentos. E 
essencial que o pesquisador realize todos os testes pos- 
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síveis para confirmar a validade da solução de agrupa- 
mentos enquanto também garante que a solução tenha 
significância prática. Os pesquisadores que minimizam 
ou pulam esse passo correm o risco de aceitar uma so- 
lução que é específica apenas para aquela amostra e que 
tem generalidade limitada ou até mesmo pouco uso além 
de sua mera descrição dos dados sobre as variáveis de 
agrupamento. 


Validação das soluções de agrupamento. O processo de 
validação é atingido em dois passos. Primeiro, os agrupa- 
mentos são avaliados quanto a validade preditiva sobre 
quatro medidas adicionais de resultado (satisfação, nível 
de compra etc.) que são indicativas do potencial para es- 
tratégias diferenciadas entre os agrupamentos. Segundo, 
a solução de agrupamentos com a maior validade de crité- 
rio é avaliada aplicando-se métodos alternativos de agru- 
pamento e comparando as soluções. 


Avaliação da validade de critério. Para avaliar a 
validade preditiva, focalizamos as variáveis que têm uma 
relação teórica com as variáveis de agrupamento mas não 
foram incluídas na solução de aglomeração. Dada essa re- 
lação, deveríamos ver diferenças significantes nessas va- 
riáveis ao longo dos agrupamentos. Se existirem diferen- 
ças significantes sobre essas variáveis, poderemos chegar à 
conclusão de que os agrupamentos descrevem agregados 
que têm validade preditiva. 


Para este propósito, consideramos quatro medidas de 
resultado: 


X, Satisfação 

X, Probabilidade de recomendar 
X, Probabilidade de comprar 
X, Nível de compra 


Estas variáveis têm uma relação conceitual com a va- 
riável estatística de agrupamento, e uma (X,5) mostrou 
ter uma relação precisa com as variáveis de agrupamen- 
to através de regressão múltipla. Cada medida de resul- 
tado é então examinada quanto a diferenças nos agrupa- 
mentos nas soluções de cinco e três agrupamentos (ver 
Tabela 8-11). 

Para a solução de cinco agrupamentos, as razões F 
univariadas mostram que as médias dos grupos para três 
das quatro variáveis são significantemente diferentes. 
Mas X,, (Probabilidade de compra) não exibe diferen- 
ças significantes ao longo dos cinco agrupamentos. No 
entanto, a solução de três agrupamentos tem diferenças 
marcantes em todas as quatro medidas de resultado. As- 
sim, apenas em termos desses testes estatísticos, a solu- 
ção de três agrupamentos é superior à de cinco. 

A solução de três agrupamentos também apóia 
as relações esperadas com as medidas de resultado? 
Como notado anteriormente, é esperado que cada 
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TABELA 8-11 Avaliação de validade de critério para as soluções não-hierárquicas de três e cinco agrupamentos 


SOLUÇÃO DE CINCO AGRUPAMENTOS 


X, Satisfação 


Xo Probabilidade de recomendar X,, Probabilidade de comprar 


X Nível de compra 


Agrupamento Centróides de agrupamento 
1 6,665 6,826 7,683 56,70 
2 7,370 7,410 7,900 65,60 
3 7,007 6,993 7,643 58,50 
4 7,800 7,125 8,042 62,42 
5 6,429 6,633 7,550 53,75 
Significância estatística de variáveis de critério 
Valor F 4,432 3,630 0,787 7,939 
Significância 0,003 0,009 0,537 0,000 
SOLUÇÃO DE TRÊS AGRUPAMENTOS 
X, Satisfação Xo Probabilidade de recomendar  X, Probabilidade de comprar X, Nível de compra 
Agrupamento Centróides de agrupamento 
1 6,411 6,693 7,446 54,36 
2 6,818 6,941 7,695 58,95 
3 7,742 7,573 8,108 63,58 
Significância estatística de variáveis de critério 
Valor F 11,566 5,998 3,781 9,166 
Significância 0,000 0,004 0,027 0,000 
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(Continuação) ; . a 
uma das medidas de resultado varie em relação às 


variáveis de agrupamento. Do exemplo de regressão 
múltipla no Capítulo 4, sabemos que as variáveis de 
agrupamento estão positivamente relacionadas a X,, 
(Satisfação). Dada essa relação, espera-se que agrupa- 
mentos com percepções melhores da HBAT tenham 
níveis maiores de satisfação. 

Se retornarmos à Figura 8-13, poderemos rever os 
perfis de cada um dos agrupamentos na solução de três 
agregados ao longo das variáveis. Nenhum desses três 
agrupamentos tem os maiores escores de percepção na 
variável estatística inteira, mas poderíamos caracterizar 
o agregado 3 como o de percepções mais favoráveis da 
HBAT no geral, porque são maiores em 6 das 10 variá- 
veis. Assim, esperaríamos que o agrupamento 3 também 
tivesse a maior satisfação com a HBAT. 

O exame de satisfação (X,9) para a solução de três 
agrupamentos na Tabela 8-11 embasa essa relação, e o 
agrupamento 3 também tem os maiores valores sobre as 
outras três medidas de resultado (X,,, X,, e X,,), como 
se esperava dada a relação das mesmas com satisfação. 
Logo, a solução de três agrupamentos tem o mais alto 
nível de validade de critério e embasa a relação encon- 
trada com outras técnicas multivariadas. 


A avaliação da validade de critério é um passo essen- 
cial na validação de qualquer solução de agrupamento. 
Em nosso caso, a solução de três agrupamentos demons- 
trou superioridade sobre a de cinco, de forma que será 
selecionada para análise posterior. Se ela for suportada 
nos testes adicionais de validação e nas análises de perfil, 
ela será designada como a solução de agrupamento mais 
adequada como base de segmentação. 


Aplicação de uma segunda análise não-hierárqui- 
ca. Como uma segunda verificação de validade quanto 
à estabilidade da solução de agrupamento, uma segunda 
análise não-hierárquica é executada, desta vez permitindo 
que o procedimento selecione ao acaso os pontos semen- 
tes iniciais para ambas as soluções. O objetivo é determi- 
nar o grau de consistência entre as duas soluções, ainda 
que elas sejam baseadas em conjuntos totalmente dife- 
rentes de pontos sementes. Um nível aceitável de consis- 
tência permitiria a suposição de uma estrutura natural de 
mercado entre as observações. 


Os resultados na Tabela 8-12 confirmam uma consistên- 
cia nos resultados para ambas as soluções de três agru- 
pamentos, uma obtida usando-se sementes especificadas 
(da análise hierárquica) e a outra usando sementes gera- 
das por amostragem (observações aleatoriamente sele- 
cionadas). Os perfis de agrupamento mostram uma cor- 
respondência geral ao longo da maior parte da variável 


estatística de agrupamento, e uma tabulação cruzada das 
soluções de agrupamento mostra que aproximadamen- 
te dois terços de cada agrupamento estão em agregados 
comparáveis em cada solução. 

Assim, dada a estabilidade dos resultados entre as 
sementes especificadas e seleção ao acaso, a administra- 
ção se sentiria confiante de que existem diferenças ver- 
dadeiras entre clientes em termos de suas percepções da 
HBAT e que a estrutura descrita na análise de agrupa- 
mentos é empiricamente embasada. 


Perfil da solução final de agrupamento. A tarefa final 
é caracterizar os agrupamentos em um conjunto de va- 
riáveis adicionais não incluídas na variável estatística de 
agrupamento ou usadas para avaliar validade preditiva. 
A importância da identificação de perfis únicos sobre es- 
ses conjuntos de variáveis adicionais reside na avaliação 
da significância prática dos mesmos e de sua base teórica. 
Ao avaliar significância prática, o pesquisador pode exigir 
que os agrupamentos exibam diferenças em um conjunto 
de variáveis adicionais. 


Nesse exemplo, várias características dos clientes da 
HBAT estão disponíveis. Essas incluem X, (tipo de 
cliente), X, (tipo de indústria), X, (tamanho da firma), 
X, (região) e X, (sistema de distribuição). A Tabela 8-13 
fornece um perfil descritivo da solução de três agrupa- 
mentos sobre essas características. Como podemos ver, 
três dessas variáveis (X,, X, e X,) mostram diferenças 
significantes nos três agrupamentos. A partir dessas va- 
riáveis, perfis distintos podem ser desenvolvidos para 
cada agrupamento. Esses perfis embasam a distinção dos 
agrupamentos sobre variáveis não usadas na análise em 
qualquer ponto anterior. 


Uma análise de segmentação bem-sucedida não ape- 
nas exige a identificação dos grupos homogêneos (agrupa- 
mentos), mas também que eles sejam identificáveis (des- 
critos de maneira única sobre outras variáveis). Quando a 
análise de agrupamentos é empregada para verificar uma 
tipologia ou outros agrupamentos propostos de objetos, 
variáveis associadas, sejam dados de entrada ou de resul- 
tados, podem ser caracterizadas para garantir a corres- 
pondência dos grupos dentro de um modelo teórico mais 
amplo. 


Uma visão gerencial do processo de agrupamentos 
A análise de agrupamentos foi usada em uma de suas apli- 
cações mais básicas — realização de uma segmentação de 
mercado. Como descrito acima, foram identificadas di- 
versas classificações possíveis para segmentação que po- 
deriam ser usadas no desenvolvimento de estratégias de 
marketing. 
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TABELA 8-12 Comparação de soluções não-hierárquicas de três agrupamentos usando sementes de uma análise de agrupamentos 


hierárquica versus sementes ao acaso 


Solução não-hierárquica de três agrupamentos baseada em sementes ao acaso 


SOLUÇÃO DE TRÊS AGRUPAMENTOS BASEADA EM SEMENTES AO ACASO 


Centróides iniciais de agrupamento 


Centróides finais de agrupamento 


Variável de agrupamento 


Variáveis de agrupamento 1 2 3 1 2 3 
X, Qualidade do produto 0,63741 0,63741 -0,93821 0,58011 —0,21708 —0,25165 
X, Atividades de comércio eletrônico —0,67379 —0,67379 0,89648 —0,34342 —0,37844 0,69466 
X, Suporte técnico 1,98307 —1,34927 —1,74131 0,64080 —0,20244 —0,49084 
X, Solução de reclamação 0,54452 —1,85534 0,95829 0,37192 —0,84803 0,54737 
Xo Anúncio —1,07370 —0,80749 2,20952 —0,25226 —0,16493 0,65205 
X,, Imagem da equipe de venda —1,23377 —2,07308 0,81785 —-0,38381 —0,42663 0,74711 
X, Preço competitivo —1,34235 —0,88929 111711 —0,74690 0,17752 0,61272 
X Garantia e reclamações 1,41143 —1,27236 —1,63833 0,62023 —0,32588 —0,44787 
Xe Encomenda e cobrança 1,20796 —1,26825 0,34667 0,34975 —0,78934 0,52858 
X,s Velocidade de entrega 0,83601 —1,88716 0,97217 0,36529 —-0,88710 0,64351 
Número de casos 35 29 29 
Tabulação cruzada de soluções não-hierárquicas de três grupos 
Sementes de análise de agrupamentos hierárquica 
Agrupamento 1 2 3 Total 
Sementes ao acaso 1 1 28 6 35 
2 18 11 29 
3 9 20 29 
Total 28 39 26 93 
Perfis de variável de agrupamento 
Solução de agrupamento baseada Solução de agrupamento baseada 
em sementes ao acaso em sementes de análise hierárquica 
1,0 1,0 
PO da A 
0,5 1 ” 1 ' (o) 0,5 + ud E 
S q :| Agrupamento S 1) q Agrupamento 
GS ' 1 o v vos 1 
N ' É N ) V4 
5 / Us 5 Ti 1 
o 1 || mao = [a yí |---2 
Too- À wo? de A ais A 
a , nd 3 E ! A 3 
D x va Pesa o k , ess 
; PA sai Ê j À 
/ Mo E K , 1 ' 
“05 a / RIRSES “0,5 1 a a E 
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Ed 
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X Xs Xe X Xo Xo XX Xo Xg Xo Xe Xe X Xo Xo Xe Xa X Xg 
Variável de agrupamento 
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TABELA 8-13 Perfil da solução não-hierárquica de três grupos sobre características associadas de firma 


Agrupamento 
X,Tipo de cliente” 1 2 3 Total 
Menos de 1 ano Número 15 9 4 28 
% dentro do agrupamento 53,6% 23,1% 15.4% 30.1% 
De 1a5anos Número 10 10 13 33 
% dentro do agrupamento 35,7% 25,6% 50,0% 35,5% 
Mais de 5 anos Número 3 20 9 32 
% dentro do agrupamento 10,7% 51,3% 34,6% 34,4% 
Total Número 28 39 26 93 
% dentro do agrupamento 100,0% 100,0% 100,0% 100,0% 
“Valor do qui-quadrado de 18,03 é significante no nível 0,001. 
Agrupamento 
X, Tipo de indústria” 1 2 3 Total 
Indústria de revistas Número 12 21 17 50 
% dentro do agrupamento 42,9% 53,8% 65,4% 53,8% 
Indústria de jornais Número 16 18 9 43 
% dentro do agrupamento 57,1% 46,2% 34,6% 46,2% 
Total Número 28 39 26 93 
% dentro do agrupamento 100,0% 100,0% 100,0% 100,0% 
*Valor do qui-quadrado de 2,752 não é significante. 
Agrupamento 
X, Tamanho da firma” 1 2 3 Total 
Pequena (0-499) Número 8 30 7 45 
% dentro do agrupamento 28,6% 76,9% 26,9% 48,4% 
Grande (500+) Número 20 9 19 48 
% dentro do agrupamento 71,4% 23,1% 73,1% 51,6% 
Total Número 28 39 26 93 
% dentro do agrupamento 100,0% 100,0% 100,0% 100,0% 
“Valor do qui-quadrado de 21,915 é significante no nível 0,001. 
Agrupamento 
X, Região” 1 2 3 Total 
EUA/América do Norte Número 7 28 4 39 
% dentro do agrupamento 25,0% 71,8% 15,4% 41,9% 
Fora da América do Norte Número 21 11 22 54 
% dentro do agrupamento 75,0% 28,2% 84,6% 58,1% 
Total Número 28 39 26 93 
% dentro do agrupamento 100,0% 100,0% 100,0% 100,0% 
“Valor do qui-quadrado de 25,106 é significante no nível 0,001. 
Agrupamento 
X, Sistema de distribuição” 1 2 3 Total 
Indireto através de corretor Número 18 22 13 53 
% dentro do agrupamento 64,3% 56,4% 50,0% 57,0% 
Direto ao cliente Número 10 17 13 40 
% dentro do agrupamento 35,7% 43,6% 50,0% 43,0% 
Total Número 28 39 26 93 
% dentro do agrupamento 100,0% 100,0% 100,0% 100,0% 


“Valor do qui-quadrado de 2,752 não é significante 
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O conjunto de análises de agrupamentos (hierárquicas e 
não-hierárquicas) foi bem sucedido em não apenas criar 
grupos homogêneos de clientes baseados em suas per- 
cepções da HBAT, mas também foi constatado que es- 
ses agrupamentos atendem aos testes de validade predi- 
tiva e distinção sobre conjuntos adicionais de variáveis, 
todos necessários para atingir significância prática. Os 
segmentos representam perspectivas bem diferentes dos 
clientes sobre a HBAT, variando em ambos os tipos de 
variáveis que são vistas mais positivamente, bem como 
na magnitude das percepções. 

Neste exemplo, a solução de três agrupamentos foi 
escolhida por causa de sua distinção e da forte relação 
com os resultados relevantes. No entanto, argumentos 
semelhantes podem ser feitos para outras soluções (p.ex., 
uma solução com dois ou cinco agrupamentos), pois elas 
também são segmentos viáveis de mercado, com tama- 
nho substancial e diferenças significativas em termos de 
percepções. Em cada caso, os agrupamentos (segmentos 
de mercado) representam conjuntos de clientes com per- 
cepções homogêneas que podem ser univocamente iden- 
tificados, sendo assim principais candidatos a programas 
de marketing diferenciados. 


Essa amplitude de possíveis abordagens de segmen- 
tação pode ser vista como um espectro de perspectivas 
alternativas sobre os clientes fornecido ao pesquisador. 
A solução de dois agrupamentos pode fornecer um deli- 
neamento básico de clientes que variam em percepções e 
comportamentos de compra, ou a solução de cinco agre- 
gados pode ser vista com uma estratégia de segmentação 
mais complexa, que fornece um composto altamente dife- 
renciado de percepções de clientes, bem como opções de 
segmentos-alvo. 


Resumo 


A análise de agrupamentos pode ser uma técnica de re- 
dução de dados muito útil. Mas sua aplicação é mais uma 
arte do que uma ciência, e pode facilmente ser usada erro- 
neamente ou com abuso pelos pesquisadores. Diferentes 
medidas de similaridade e diferentes algoritmos podem 
afetar os resultados, e de fato o fazem. Se o pesquisador 
procede com cautela, contudo, a análise de agrupamentos 
pode ser uma valiosa ferramenta para identificar padrões 
latentes, pela sugestão de agrupamentos úteis de objetos 
que não são discerníveis por meio de outras técnicas mul- 
tivariadas. Este capítulo ajuda você a fazer o seguinte: 


Definir análise de agrupamentos, seus papéis e suas limita- 
ções. Análise de agrupamentos é um conjunto de técni- 
cas multivariadas cuja principal meta é reunir objetos com 
base nas características que eles possuem. A análise de 
agrupamentos classifica objetos (p.ex., respondentes, pro- 
dutos ou outras coisas) de modo que cada objeto é similar 


a outros no agrupamento em relação a um conjunto de 
características selecionadas. Os agrupamentos resultantes 
de objetos devem exibir elevada homogeneidade interna 
(dentro do agrupamento) e elevada heterogeneidade ex- 
terna (entre agrupamentos). Se o processo é bem sucedi- 
do, os objetos dentro dos agrupamentos estarão próximos 
uns dos outros quando representados geometricamente, e 
diferentes agrupamentos estarão distantes entre si. Entre 
os papéis mais comuns executados pela análise de agrupa- 
mentos estão: (1) redução de dados, na qual um pesquisa- 
dor coleta dados por meio de um questionário e se depara 
com uma grande quantia de observações que carecem de 
sentido a menos que sejam classificadas em grupos admi- 
nistráveis, e (2) geração de hipóteses, na qual a análise 
de agrupamentos é utilizada para desenvolver hipóteses 
sobre a natureza dos dados ou para examinar hipóteses 
anteriormente estabelecidas. As críticas mais comuns e, 
portanto, as limitações da análise de agrupamentos são: 
(1) seu caráter descritivo, não-teórico e não-inferencial; 
(2) sua capacidade de sempre criar agrupamentos, inde- 
pendentemente da existência de qualquer estrutura real 
nos dados; e (3) a falta de generalidade das soluções devi- 
do ao fato de serem totalmente dependentes das variáveis 
usadas como base da medida de similaridade. 


Identificar as questões de pesquisa abordadas na análise 
de agrupamentos. Ao formar grupos homogêneos, a 
análise de agrupamentos pode abordar qualquer combi- 
nação de três questões básicas de pesquisa: 


1. Descrição taxonômica. O uso mais tradicional de análise de 
agrupamentos tem sido para fins exploratórios e para a for- 
mação de uma taxonomia — uma classificação empírica de 
objetos. Como descrita anteriormente, a análise de agrupa- 
mentos tem sido utilizada em uma vasta gama de aplicações 
por sua habilidade de partição. Análise de agrupamentos 
pode também gerar hipóteses relacionadas à estrutura dos 
objetos. Finalmente, apesar de vista principalmente como 
uma técnica exploratória, a análise de agrupamentos pode 
ser utilizada para fins confirmatórios. Em tais casos, uma ti- 
pologia (classificação teórica) proposta pode ser comparada 
com aquela derivada da análise de agrupamentos. 

2. Simplificação de dados. Definindo estrutura entre as obser- 
vações, a análise de agrupamentos também desenvolve uma 
perspectiva simplificada pela agregação de observações para 
análise posterior. Enquanto a análise fatorial tenta fornecer 
dimensões ou estrutura para variáveis, a análise de agrupa- 
mentos executa a mesma tarefa para observações. Assim, 
em vez de todas as observações serem vistas como únicas, 
elas podem ser vistas como membros de agrupamentos e 
descritas por meio de suas características gerais. 

3. Identificação de relação. Com os agrupamentos definidos 
e a estrutura inerente dos dados representada nos agrupa- 
mentos, o pesquisador tem uma maneira de revelar relações 
entre as observações que tipicamente não é possível com 
as observações individuais. Se técnicas como a análise dis- 
criminante são empregadas para identificar empiricamente 
relações, ou se os grupos são examinados por métodos mais 
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qualitativos, a estrutura simplificada da análise de agrupa- 
mentos frequentemente identifica relações ou similaridades 
e diferenças que não foram previamente reveladas. 


Compreender como é medida a similaridade entre obje- 
tos. Similaridade entre objetos pode ser medida de diver- 
sas maneiras. Três métodos dominam as aplicações da aná- 
lise de agrupamentos: medidas correlacionais, de distância 
e por associação. Cada um desses métodos representa uma 
perspectiva particular sobre similaridade, dependendo 
de seus objetivos e do tipo de dados. As medidas corre- 
lacionais e baseadas em distância requerem dados métri- 
cos, enquanto as medidas por associação são para dados 
não-métricos. Medidas correlacionais são raramente usa- 
das, pois a ênfase na maioria das aplicações da análise de 
agrupamentos é sobre as magnitudes dos objetos, e não os 
padrões de valores. Medidas de distância são as medidas 
mais comuns de similaridade em análise de agrupamentos. 
As medidas de distância representam similaridade como a 
proximidade de observações entre si ao longo de variáveis 
na variável estatística de agrupamento. 


Distinguir entre as várias medidas de distância. Di- 
versas medidas de distância estão disponíveis, cada uma 
com características específicas. Distância euclidiana é a 
mais comumente reconhecida, muitas vezes chamada de 
distância em linha reta. A distância euclidiana entre dois 
pontos é o comprimento da hipotenusa de um triângulo 
retângulo. Este conceito é facilmente generalizado para 
mais de duas variáveis. Distância euclidiana quadrada (ou 
absoluta) é a soma de diferenças quadradas sem se calcu- 
lar a raiz quadrada. A distância euclidiana quadrada tem 
a vantagem de não extrair a raiz quadrada, o que acelera 
consideravelmente a computação e é a medida de distân- 
cia recomendada para os métodos centróide e de Ward de 
agrupamento. A distância city-block (Manhattan) não se 
baseia na euclidiana. No lugar disso, ela usa a soma das di- 
ferenças absolutas das variáveis (ou seja, os dois catetos de 
um triângulo retângulo em vez da hipotenusa). Tal proce- 
dimento é o mais simples para calcular, mas pode conduzir 
a agregados inválidos se as variáveis de agrupamento fo- 
rem altamente correlacionadas. A distância de Chebychev 
é outra medida. Com ela, distância é a maior diferença ao 
longo de todas as variáveis. É particularmente suscetível 
a diferenças em escalas ao longo das variáveis. A distân- 
cia de Mahalanobis (D”) é uma medida generalizada que 
explica as correlações entre variáveis de uma maneira que 
pondera cada variável igualmente. Também se sustenta 
em variáveis padronizadas. 


Diferenciar entre algoritmos de agrupamento. O algo- 
ritmo de agrupamento em um processo hierárquico de- 
termina como é definida similaridade entre agregados de 
múltiplos membros no processo. Os cinco algoritmos hie- 
rárquicos mais populares são (1) ligação simples, (2) liga- 
ção completa, (3) ligação média, (4) método centróide e 


(5) método de Ward. Os três algoritmos não-hierárquicos 
são (1) o método de referência sequencial que seleciona 
uma semente e inclui todos os objetos dentro de uma dis- 
tância especificada, (2) o método de referência paralela 
que considera todas as sementes simultaneamente e de- 
signa observações dentro da distância de referência para 
a semente mais próxima, e (3) o procedimento de otimi- 
zação, que é semelhante aos outros dois métodos não-hie- 
rárquicos, exceto que ele permite uma nova designação 
de observações. Técnicas hierárquicas têm sido há mui- 
to tempo o método mais popular de agrupamento, com 
o método de Ward e a ligação média provavelmente os 
mais disponíveis. Métodos não-hierárquicos têm conquis- 
tado crescente aceitabilidade e uso, mas qualquer aplica- 
ção depende da habilidade do pesquisador em escolher 
os pontos sementes de acordo com alguma base teórica, 
objetiva ou prática. 


Compreender as diferenças entre técnicas hierárquicas e 
não-hierárquicas. Uma vasta gama de procedimentos de 
partição tem sido proposta para a análise de agrupamen- 
tos. Os dois procedimentos mais usados são hierárquicos 
e não-hierárquicos. Métodos hierárquicos envolvem uma 
série de n 1 decisões (onde n é o número de observações) 
que combinam observações em uma estrutura hierárquica 
ou do tipo árvore. Os dois tipos de procedimentos hierár- 
quicos incluem o aglomerativo e o divisivo. Nos métodos 
aglomerativos, cada objeto ou observação começa como 
seu próprio agrupamento, enquanto nos métodos divisi- 
vos todas as observações iniciam em um único agregado 
e são sucessivamente divididas (primeiro em dois agrupa- 
mentos, em seguida em três e assim por diante) até que 
cada uma forma um agregado unitário. 

Em contraste com métodos hierárquicos, os proce- 
dimentos não-hierárquicos não envolvem o processo de 
construção em árvore. No lugar disso, eles designam ob- 
jetos em agregados assim que o número de agrupamentos 
a serem formados seja especificado. Por exemplo, uma 
solução de seis agrupamentos não é somente uma combi- 
nação de dois agregados a partir da solução de sete, mas 
é baseada somente na descoberta da melhor solução de 
seis agrupamentos. O processo tem dois passos: (1) iden- 
tificação de pontos iniciais, conhecidos como sementes de 
agrupamento, para cada agregado, e (2) designação de 
cada observação a uma das sementes com base em simi- 
laridade. 


Descrever como selecionar o número de agrupamentos a 
serem formados. Talvez a questão que causa mais per- 
plexidade para qualquer pesquisador que executa uma 
análise hierárquica ou não-hierárquica seja a determina- 
ção do número de agrupamentos mais representativos dos 
dados da amostra. Tal decisão é crítica para técnicas hie- 
rárquicas, pois, ainda que o processo gere o conjunto com- 
pleto de soluções, o pesquisador deve escolher as soluções 
para representar a estrutura de dados (também conhecida 
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como a regra de parada). Esta decisão também é encarada 
por pesquisadores em análises não-hierárquicas quando a 
solução ótima deve ser escolhida a partir de duas ou mais 
soluções de agrupamento. Infelizmente, não existe qual- 
quer procedimento padrão e objetivo de escolha. Sem um 
critério estatístico interno de inferência, como os testes de 
significância estatística de outros métodos multivariados, 
pesquisadores têm desenvolvido muitos critérios para tra- 
tar o problema. As duas principais regras de parada são 
(1) medidas de variação de heterogeneidade entre agru- 
pamentos em cada passo sucessivo, com a solução defini- 
da quando a medida de heterogeneidade excede um valor 
especificado ou quando os valores sucessivos entre passos 
saltam repentinamente, e (2) medidas diretas de hetero- 
geneidade de cada solução. Dado o número disponível de 
regras de parada e a falta de evidência apoiando qualquer 
regra em especial, o pesquisador deve usar diversas delas 
e procurar por uma solução que seja consenso. Mesmo 
com um consenso baseado em medidas empíricas, o pes- 
quisador deve complementar o julgamento empírico com 
alguma conceituação de relações teóricas que possam su- 
gerir um número natural de agrupamentos. 


Seguir as diretrizes para validação de agrupamento. Va- 
lidação envolve tentativas do pesquisador para garan- 
tir que a solução é representativa da população geral e, 
assim, é generalizável para outros objetos e é estável ao 
longo do tempo. A abordagem mais direta de validação é 
a análise de amostras separadas, comparando as soluções 
de agrupamento e avaliando a correspondência dos re- 
sultados. O pesquisador pode também tentar estabelecer 
alguma forma de validade preditiva ou de critério. Para 
isso, variáveis não usadas para formar os agrupamentos, 
mas conhecidas como variando ao longo dos agrupamen- 
tos, são escolhidas e comparadas. 


Construir perfis para os agrupamentos derivados e ava- 
liar significância administrativa. O estágio de perfil en- 
volve a descrição das características de cada agrupamento 
para explicar como eles podem diferir sobre dimensões 
relevantes. O procedimento começa depois que os agre- 
gados são identificados, e tipicamente envolve o emprego 
de análise discriminante ou ANOVA. Dados não previa- 
mente incluídos no procedimento de agrupamento são 
usados para caracterizar cada agregado. Esses dados ge- 
ralmente são características demográficas, perfis psicográ- 
ficos, padrões de consumo e assim por diante. Apesar de 
poder não existir qualquer argumento para diferenças em 
variáveis ao longo dos agrupamentos, como se exige para 
avaliação de validade preditiva, elas devem ter pelo me- 
nos importância prática. Usando análise discriminante ou 
ANOVA, o pesquisador compara perfis de escore médio 
para os agregados. A variável dependente categórica (ou 
o fator em ANOVA) se refere aos agrupamentos previa- 
mente identificados, e as variáveis independentes são as 
características demográficas, psicográficas etc. A análise 


de perfil se concentra na descrição não do que diretamen- 
te determina os agregados, mas nas características dos 
agrupamentos depois que os mesmos foram identificados. 
A ênfase está na identificação de características que dife- 
renciem significativamente ao longo dos agrupamentos e 
naquelas que podem prever pertinência em um agregado 
em particular. 

A seleção da solução final, na maioria dos casos, é ba- 
seada em considerações tanto objetivas quanto subjetivas. 
O pesquisador prudente considera essas questões e sem- 
pre avalia o impacto de todas as decisões. A análise de 
agrupamentos, juntamente com o escalonamento multidi- 
mensional, devido a uma carência de base estatística para 
inferência à população, são os métodos que mais precisam 
de replicação sob condições variáveis. 


Questões 


1. Quais são os estágios básicos na aplicação da análise de 
agrupamentos? 

2. Qual é o propósito da análise de agrupamentos e quando 
ela deve ser usada no lugar da análise fatorial? 

3. O que o pesquisador deve considerar quando seleciona 
uma medida de similaridade para usar em análise de agru- 
pamentos? 

4. Como o pesquisador sabe quando empregar técnicas hie- 
rárquicas ou não-hierárquicas de agrupamentos? Sob quais 
condições cada abordagem deve ser usada? 

5. Como um pesquisador decide o número de agrupamentos 
necessários em sua solução? 

6. Qual é a diferença entre o estágio de interpretação e o de 
perfil e validação? 

7. Como os pesquisadores podem usar as representações gráfi- 
cas do procedimento de aglomeração? 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustra problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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CAPÍTULO 


Escalonamento Multidimensional e 
Análise de Correspondência 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


Definir escalonamento multidimensional e descrever como é executado. 
Compreender as diferenças entre dados de similaridade e dados de preferência. 
Escolher entre uma abordagem decomposicional ou composicional. 

Determinar a comparabilidade e número de objetos. 

Entender como criar um mapa perceptual. 

Explicar análise de correspondência como um método de mapeamento perceptual. 


Apresentação do capítulo 


O escalonamento multidimensional (MDS) se refere a uma série de técnicas que ajudam o pesquisador 
a identificar dimensões-chave inerentes a avaliações feitas por respondentes quanto a objetos e então 
posicionar tais objetos neste espaço dimensional. Por exemplo, o escalonamento multidimensional fre- 
quentemente é usado em marketing para identificar dimensões-chave inerentes a avaliações que os 
consumidores fazem quanto a produtos, serviços ou empresas. Outras aplicações comuns incluem a 
comparação de qualidades físicas (p.ex., sabores de alimentos ou aromas), percepções sobre candi- 
datos ou questões políticas, e até mesmo a avaliação de diferenças culturais entre grupos distintos. As 
técnicas de escalonamento multidimensional podem inferir as dimensões subjacentes usando apenas 
uma série de julgamentos de similaridades ou preferência fornecidos por respondentes quanto a obje- 
tos. Com os dados em mãos, o escalonamento multidimensional pode ajudar a determinar o número e 
a importância relativa das dimensões usadas pelos respondentes quando avaliam objetos, e como os 
objetos estão relacionados em termos de percepção sobre essas dimensões, geralmente retratadas 
graficamente. 

A análise de correspondência (CA) é uma técnica relacionada com metas parecidas. A CA infere 
as dimensões inerentes que são avaliadas, bem como o posicionamento de objetos, ainda que siga 
uma abordagem bastante diferente. Primeiro, em vez de usar avaliações gerais de similaridade ou 
preferência relativas a objetos, cada um deles é avaliado (em termos não-métricos) sobre uma série 
de atributos. Em seguida, com esta informação a CA desenvolve as dimensões de comparação entre 
objetos e coloca cada objeto neste espaço dimensional para permitir comparações entre objetos e 
atributos simultaneamente. 


Termos-chave cruzadas estão em itálico. Exemplos ilustrativos estão em 


: quadros. 
Antes de começar o capítulo, leia os termos-chave para 


compreender os conceitos e a terminologia empregados. — Agrupamento subjetivo Ver dados de contusão. 
Ao longo do capítulo, os termos-chave aparecem em ne- Análise agregada Abordagem à MDS na qual um mapa per- 
grito. Outros pontos de destaque no capítulo e referências ceptual é gerado para as avaliações de um grupo de respon- 
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dentes quanto a objetos. Esse mapa perceptual composto 
pode ser criado por um programa de computador ou pelo 
pesquisador para achar alguns poucos sujeitos “médios” ou 
representativos. 

Análise de correspondência (CA) Abordagem composicional 
para mapeamento perceptual que é baseada em categorias 
de uma tabela de contingência. A maioria das aplicações en- 
volve um conjunto de objetos e atributos, em que os resul- 
tados retratam objetos e atributos em um mapa perceptual 
comum. Para derivar um mapa multidimensional, você deve 
ter um mínimo de três atributos e três objetos. 

Análise de correspondência múltipla Forma de análise de cor- 
respondência que envolve três ou mais variáveis categóricas 
relacionadas em um espaço perceptual comum. 

Análise desagregada Abordagem para MDS na qual o pesqui- 
sador gera mapas perceptuais em uma base de respondente 
por respondente. Os resultados podem ser difíceis de genera- 
lizar para os respondentes. Portanto, o pesquisador pode ten- 
tar criar menos mapas por algum processo de análise agrega- 
da, na qual os resultados de respondentes são combinados. 

Avaliação subjetiva Método para determinar quantas dimen- 
sões são representadas no modelo MDS. O pesquisador faz 
uma inspeção subjetiva dos mapas espaciais e questiona se 
a configuração parece razoável. O objetivo é obter o melhor 
ajuste com o menor número de dimensões. 

Dados de confusão Procedimento para obter percepções de 
respondentes sobre dados de similaridades. Os responden- 
tes indicam as similaridades entre pares de estímulos. O par 
(ou “confusão”) de um estímulo com um outro é assumido 
para indicar similaridades. Também conhecido como agrupa- 
mento subjetivo. 

Dados de preferência Dados usados para determinar a pre- 
ferência entre objetos. Podem ser contrastados com dados 
de similaridade, que denota a similaridade entre objetos, mas 
não tem distinção do tipo “bom-ruim” como visto nos dados 
de preferência. 

Dados de similaridades Dados usados para determinar quais 
objetos são os mais semelhantes entre si e quais são os mais 
distintos. Implícita nas medidas de similaridades está a ha- 
bilidade de comparar todos os pares de objetos. Três pro- 
cedimentos para obter dados de similaridades são compa- 
rações aos pares de objetos, dados de confusão e medidas 
derivadas. 

Dimensão objetiva Características físicas ou tangíveis de um 
objeto que têm uma base objetiva de comparação. Por exem- 
plo, um produto tem tamanho, forma, cor, peso e assim por 
diante. 

Dimensão percebida Uma atribuição subjetiva, por parte do 
respondente, de aspectos a um objeto, a qual representa 
suas características intangíveis. Exemplos incluem “qualida- 
de”, “caro” e “boa aparência”. Essas dimensões percebidas 
são únicas do respondente individual e podem exibir pouca 
correspondência com dimensões objetivas reais. 

Dimensão subjetiva Ver dimensão percebida. 

Dimensionalidade inicial Um ponto de partida para selecio- 
nar a melhor configuração espacial para dados. Antes de ini- 


ciar um procedimento MDS, o pesquisador deve especificar 
quantas dimensões ou características estão representadas 
nos dados. 

Dimensões Características de um objeto. Pode-se imaginar 
que um objeto específico possui dimensões percebidas/ 
subjetivas (p. ex., caro, frágil) e objetivas (p. ex., cor, preço, 
características). 

Disparidades Diferenças nas distâncias geradas no computa- 
dor que representam similaridades e as distâncias fornecidas 
pelo respondente. 

Escala de similaridade Escala arbitrária, por exemplo, de -5 a 
+5, que permite a representação de uma relação ordenada 
entre objetos que vai do mais semelhante (mais próximo) ao 
menos similar (mais distante). Esse tipo de escala é adequa- 
do apenas para representar uma única dimensão. 

Expansão Transformação de uma solução MDS para fazer as 
dimensões ou elementos individuais refletirem o peso relativo 
de preferência. 

Índice de ajuste Índice de correlação quadrada (R?) que pode 
ser interpretado como indicativo da proporção de variância 
das disparidades (dados otimamente escalonados) que pode 
ser explicada pelo procedimento MDS. Ele mede o quão bem 
os dados iniciais se ajustam ao modelo MDS. Esse índice é 
uma alternativa para a medida de desajuste para determinar o 
número de dimensões. Semelhante a medidas de covariância 
em outras técnicas multivariadas, medidas de 0,60 ou mais 
são consideradas aceitáveis. 

Inércia Uma medida relativa de qui-quadrado usada em aná- 
lise de correspondência. A inércia total de uma tabela de 
tabulação cruzada é calculada como o qui-quadrado total 
dividido pela frequência total (soma de linhas ou colunas). 
Inércia pode então ser calculada para cada categoria de lIi- 
nha ou coluna para representar sua contribuição ao total da 
inércia. 

Mapa espacial Ver mapa perceptual. 

Mapa perceptual Representação visual de percepções que um 
respondente tem sobre objetos em duas ou mais dimensões. 
Geralmente esse mapa tem níveis opostos de dimensões 
nos extremos dos eixos X e Y, como de “doce” a “azedo” 
nos extremos do eixo X e de “caro” a “barato” nos extremos 
do eixo Y. Cada objeto então tem uma posição espacial no 
mapa perceptual que reflete a similaridade ou preferência 
relativa a outros objetos no que se refere às dimensões do 
mapa perceptual. 


Massa Uma medida relativa de frequência usada em análise de 
correspondência para descrever o tamanho de qualquer cé- 
lula ou categoria em uma tabulação cruzada. É definida como 
o valor (total da célula ou categoria) dividido pela frequência 
total, gerando o percentual da frequência total representado 
pelo valor. Como tal, a massa total ao longo de linhas, colunas 
ou todas as entradas de célula é 1,0. 

Matriz de importância-desempenho Abordagem bidimensio- 
nal para auxiliar o pesquisador na nomeação de dimensões. 
O eixo vertical é a percepção de importância do respondente 
(p.ex., medida em uma escala de “extremamente importante” 
a “nada importante”). O eixo horizontal é desempenho (p.ex., 
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como se mede em uma escala de “excelente” a “péssimo”) 
para cada marca ou produto/serviço sobre vários atributos. 
Cada objeto é representado por seus valores em importância 
e desempenho. 

Medida de desajuste Proporção da variância das disparidades 
(dados otimamente escalonados) não explicada pelo modelo 
MDS. Esse tipo de medida varia de acordo com o tipo de pro- 
grama e de dados em análise. A medida de desajuste ajuda 
a determinar o número adequado de dimensões a serem in- 
cluídas no modelo. 

Medidas derivadas Procedimento para obter percepções de 
dados de similaridades por parte dos respondentes. Simila- 
ridades derivadas geralmente são baseadas em uma série 
de escores dados aos estímulos pelos respondentes, que 
são então combinados de alguma maneira. A escala dife- 
rencial semântica frequentemente é usada para deduzir tais 
escores. 

Método composicional Abordagem para mapeamento per- 
ceptual que deriva avaliações gerais de similaridade ou 
preferência a partir de avaliações de atributos separados 
por respondente. Com métodos composicionais, avaliações 
de atributos separados são combinadas (compostas) para 
uma avaliação geral. Os exemplos mais comuns de métodos 
composicionais são as técnicas de análise fatorial e análise 
discriminante. 

Método decomposicional Método de mapeamento perceptu- 
al associado a técnicas MDS no qual o respondente fornece 
apenas uma avaliação geral de similaridade ou preferência 
entre objetos. Esse conjunto de avaliações gerais é então de- 
composto em um conjunto de dimensões que melhor repre- 
sentam as diferenças de objetos. 

Objeto Qualquer estímulo que pode ser comparado e avaliado 
pelo respondente, incluindo entidades tangíveis (produto ou 
objeto físico), ações (serviço), percepções sensoriais (cheiro, 
sabor, impressões visuais), ou mesmo pensamentos (idéias, 
slogans). 

Ponto ideal Ponto em um mapa perceptual que representa a 
combinação mais preferida de atributos percebidos (de acor- 
do com os respondentes). Uma suposição importante é que 
a posição do ponto ideal (relativa aos outros objetos no mapa 
perceptual) definiria a preferência relativa, de modo que ob- 
jetos mais distantes do ponto ideal deveriam ser menos pre- 
feridos. 

Preferência Implica que objetos são julgados pelo respondente 
em termos de relações de predomínio; ou seja, os estímulos 
são ordenados em preferência com relação a alguma proprie- 
dade. Ordenação direta, comparações aos pares e escalas 
de preferência frequentemente são usadas para determinar 
preferências de respondentes. 

Projeções Pontos definidos por retas perpendiculares de um 
objeto a um vetor. As projeções são usadas para determinar a 
ordem de preferência com representações vetoriais. 

Revelação Representação das preferências de um indivíduo 
dentro de um espaço comum (agregado) de estímulos obtido 
para todos os respondentes como um todo. As preferências 
do indivíduo são “reveladas” e apresentadas como a melhor 
representação possível dentro da análise agregada. 


Similaridade Ver dados de similaridades. 

Solução degenerada Solução MDS que é inválida por causa 
de (1) inconsistências nos dados ou (2) muito poucos objetos 
em comparação ao número de dimensões especificado pelo 
pesquisador. Mesmo que o programa de computador possa 
indicar uma solução válida, o pesquisador deve desconsi- 
derar a solução degenerada e examinar os dados em busca 
da causa. Esse tipo de solução normalmente é representado 
como um padrão circular de resultados ilógicos. 

Tabela de contingência Tabulação cruzada de duas variá- 
veis não-métricas ou categóricas na qual as entradas são 
as frequências de respostas que caem em cada “célula” da 
matriz. Por exemplo, se três marcas foram avaliadas sobre 
quatro atributos, a tabela de contingência de marca por atri- 
buto seria uma tabela com três linhas e quatro colunas. As 
entradas seriam o número de vezes que uma marca (p.ex., 
Coca-Cola) foi avaliada como tendo um atributo (p.ex., sa- 
bor doce). 

Tabela de tabulação cruzada Ver tabela de contingência. 

Valor qui-quadrado Método para analisar dados em uma tabe- 
la de contingência que compara as frequências reais das cé- 

lulas da tabela com as frequências esperadas das mesmas. A 

frequência esperada de uma célula é baseada nas probabili- 

dades marginais de sua linha e coluna (probabilidade de uma 
linha e coluna entre todas as linhas e colunas). 

Vetor Método para representar um ponto ideal ou atributo em 

um mapa perceptual. Envolve o uso de projeções para deter- 

minar a ordem de um objeto no vetor. 


O QUE É ESCALONAMENTO 
MULTIDIMENSIONAL? 


Escalonamento multidimensional (MDS), também conhe- 
cido como mapeamento perceptual, é um procedimento 
que permite a um pesquisador determinar a imagem re- 
lativa percebida de um conjunto de objetos (empresas, 
produtos, idéias ou outros itens associados a percepções 
comumente consideradas). O objetivo do MDS é transfor- 
mar julgamentos de consumidores quanto à similaridade 
ou preferência (p.ex., preferência por lojas ou marcas) em 
distâncias representadas em espaço multidimensional. 


Comparação de objetos 


Escalonamento multidimensional é baseado na compa- 
ração de objetos (p.ex., produto, serviço, pessoa, aro- 
ma). O MDS difere de outros métodos multivariados no 
sentido de usar apenas uma medida geral de similaridade 
ou preferência. Para executar uma análise de escalona- 
mento multidimensional, o pesquisador realiza três pas- 
sos básicos: 


1. Reunir medidas de similaridade ou de preferência no con- 
junto inteiro de objetos a serem analisados. 

2. Usar técnicas MDS para estimar a posição relativa de cada 
objeto em espaço multidimensional. 
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3. Identificar e interpretar os eixos do espaço dimensional em 
termos de atributos perceptuais e/ou objetivos. 


Considere que os objetos A e B sejam julgados por 
respondentes como os mais parecidos se comparados com 
todos os outros possíveis pares de objetos (AC, BC, AD e 
assim por diante). Técnicas MDS posicionam os objetos A 
e B de modo que a distância entre eles no espaço multidi- 
mensional seja menor do que a distância entre quaisquer 
outros pares de objetos. O mapa perceptual resultante, 
também conhecido como mapa espacial, mostra a posição 
relativa de todos os objetos, como mostra a Figura 9-1. 


Dimensões: a base para comparação 


Qual é a base para a posição relativa de cada objeto? Por 
que A e B são mais parecidos do que quaisquer outros pa- 
res de objetos (p.ex., A e D)? O que representam os eixos 
do espaço multidimensional? Antes de tentarmos respon- 
der qualquer uma dessas questões, primeiramente deve- 
mos reconhecer que qualquer objeto pode ser imaginado 
como tendo dimensões que representam as percepções de 
um indivíduo quanto a atributos ou combinações dos mes- 
mos. Essas dimensões podem representar um único atri- 
buto/percepção ou idéia, ou podem ser uma composição 
de qualquer número de atributos (p.ex., reputação). 


Dimensões objetivas versus subjetivas 

Quando se caracteriza um objeto, é importante também 
lembrar que indivíduos podem usar diferentes tipos de 
medidas ao se realizar tais julgamentos. Por exemplo, 
uma medida é uma dimensão objetiva que tem atributos 
quantificáveis (físicos ou observáveis). Outro tipo de me- 
dida é uma dimensão percebida (também conhecida como 
dimensão subjetiva), na qual indivíduos avaliam os obje- 
tos com base em percepções. Neste caso, a dimensão per- 


Dimensão Il 


O 
E) 


cebida é uma interpretação feita pelo indivíduo que pode 
ou não ser baseada em dimensões objetivas. 


Por exemplo, uma administração pode perceber seu pro- 
duto (um cortador de grama) como tendo duas opções 
de cor (vermelho e verde), um motor de dois cavalos- 
vapor e uma lâmina de 24 polegadas, que são as dimen- 
sões objetivas. Os clientes, contudo, podem (ou não) ver 
esses atributos. Os clientes podem focar uma dimensão 
percebida, como o cortador de grama ser caro ou frágil. 


Dois objetos podem ter as mesmas características físi- 
cas (dimensões objetivas) mas serem percebidos de ma- 
neira distinta porque os objetos são vistos com diferen- 
ças de qualidade (uma dimensão percebida) por muitos 
consumidores. Assim, as duas diferenças a seguir entre 
dimensões objetivas e de percepção são importantes: 


e Diferenças individuais: As dimensões percebidas por clien- 
tes podem não coincidir com (ou mesmo não incluir) as 
dimensões objetivas assumidas pelo pesquisador. Espe- 
ramos que cada indivíduo possa ter diferentes dimensões 
percebidas, mas o pesquisador também deve aceitar que as 
dimensões objetivas podem igualmente variar muito. Os in- 
divíduos podem considerar diferentes conjuntos de caracte- 
rísticas objetivas, bem como pode variar a importância que 
associam a cada dimensão. 

e Interdependência: As avaliações das dimensões (mesmo 
quando as dimensões percebidas são as mesmas que as ob- 
jetivas) podem não ser independentes e não concordarem. 
Tanto as dimensões percebidas quanto as objetivas podem 
interagir umas com as outras para criar avaliações inespe- 
radas. Por exemplo, um refrigerante é julgado como mais 
doce do que outro porque o primeiro tem um aroma mais 
parecido com fruta, apesar de ambos terem a mesma quan- 
tia de açúcar. 


(1) 


Dimensão | 


(5) 


FIGURA 9-1 


(o) 


Ilustração de um mapa multidimensional de percepções de seis fornecedores industriais (A a F) e do ponto ideal (IP). 
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Relação entre dimensões objetivas e subjetivas 

O desafio para o pesquisador é compreender como as di- 
mensões percebidas e objetivas se relacionam com os ei- 
xos do espaço multidimensional usados no mapa percep- 
tual, se possível. É semelhante à interpretação da variável 
estatística em muitas outras técnicas multivariadas (p.ex., 
o “rótulo” de fatores em análise fatorial), mas difere no 
sentido de que o pesquisador jamais usa diretamente 
quaisquer avaliações de atributos (p.ex., de qualidade, 
apelo etc.) quando obtém as avaliações de similaridade 
entre objetos. Em vez disso, o pesquisador coleta somen- 
te similaridade ou preferência. 

O uso de somente medidas gerais (similaridade ou pre- 
ferência) requer que o pesquisador primeiramente com- 
preenda a correspondência entre dimensões perceptuais 
e objetivas com os eixos do mapa perceptual. Em seguida, 
uma análise adicional pode identificar quais atributos pre- 
vêem a posição de cada objeto tanto no espaço perceptual 
quanto no objetivo. 

Uma advertência deve ser feita, porém, quanto à inter- 
pretação de dimensões. Como esse processo é mais uma 
arte do que uma ciência, o pesquisador deve resistir à ten- 
tação de permitir que a percepção pessoal afete a dimen- 
sionalidade qualitativa das dimensões percebidas. Dado o 
nível de interferência do pesquisador, deve-se tomar cui- 
dado para ser o mais objetivo possível nessa área crítica, 
ainda que rudimentar. 


UMA VISÃO SIMPLIFICADA SOBRE 


COMO FUNCIONA O MDS 


Para facilitar uma melhor compreensão dos procedimen- 
tos básicos em escalonamento multidimensional, primei- 
ro apresentamos um exemplo simples para ilustrar os 
conceitos básicos inerentes ao MDS e o procedimento 
pelo qual ele transforma julgamentos de similaridades 
nas posições espaciais correspondentes. Seguimos os três 
passos básicos descritos anteriormente. 


Obtenção de julgamentos de similaridade 


O primeiro passo é obter julgamentos de similaridade de 
um ou mais respondentes. Aqui solicitamos aos respon- 


dentes uma medida única de similaridade para cada par 
de objetos. 


Pesquisadores de mercado estão interessados em com- 
preender percepções de consumidores quanto a seis do- 
ces que estão atualmente no mercado. Em vez de tentar 
reunir informações sobre avaliações de consumidores 
quanto a doces em vários atributos, os pesquisadores 
reunirão apenas percepções de similaridades ou dissi- 
milaridades gerais. Os dados normalmente são coleta- 
dos com respondentes que fornecem respostas globais 
simples a declarações como as seguintes: 


e Avalie as similaridades dos produtos A e B em uma 
escala de 10 pontos. 

e O produto A é mais similar a Bdo que aC. 

e Gosto mais do produto A do que do produto B. 


Criação de um mapa perceptual 


A partir dessas respostas simples, pode ser esboçado um 
mapa perceptual que melhor represente o padrão geral 
de similaridades entre os doces. Ilustramos o processo de 
criação de um mapa perceptual com os dados de um único 
respondente, apesar de que esse processo também pode- 
ria ser aplicado a múltiplos respondentes ou às respostas 
agregadas de um grupo de consumidores. 


Os dados são reunidos primeiramente criando-se um 
conjunto dos únicos 15 pares dos seis doces (6 x 5/2 = 
15). Depois de experimentarem os doces, os respon- 
dentes devem ordenar os 15 pares de doces, onde um 
nível 1 é designado ao par de doces mais semelhantes 
e um nível 15 indica o par menos parecido. Os resul- 
tados (ordenações) para todos os pares de doce para 
um respondente estão na Tabela 9-1. Este respondente 
considerou que os doces D e E são os mais parecidos, 
A e B são os próximos doces mais semelhantes e assim 
por diante, até o momento em que E e F são os menos 
similares. 


TABELA 9-1 Dados de similaridade (ordenações) para pares de doces 
Doce A B Cc D E F 
A — 2 13 4 3 8 
B — 12 6 5 7 
(0) — 9 10 11 
D — 1 14 
E - 15 
F sm 


Nota: Valores menores indicam maior similaridade, sendo 1 o par mais semelhante e 15 o menos parecido. 
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Se quisermos ilustrar a similaridade entre doces grafi- 
camente, uma primeira tentativa será esboçar uma única 
escala de similaridades e ajustar todos os doces a ela. Nes- 
ta representação unidimensional de similaridades, distân- 
cia representa a similaridade. Assim, os objetos mais pró- 
ximos na escala são mais parecidos, e os mais distantes são 
menos semelhantes. O objetivo é posicionar os doces na 
escala de forma que as ordenações sejam mais bem repre- 
sentadas (ordem 1 é a mais próxima, ordem 2 é a segunda 
mais próxima e assim por diante). 


Tentemos ver como colocaríamos alguns dos objetos. 
Posicionar dois ou três doces é trivial. O primeiro teste 
real acontece com quatro objetos. Escolhemos os doces 
A,B,CeD. A Tabela 9-1 mostra que a ordenação dos 
pares é como se segue: AB< AD <BD<CD<BC< 
AC (cada par de letras indica a distância [similarida- 
de] entre os elementos do par). A partir desses valores, 
devemos colocar os quatro doces em uma única escala, 
de forma que os mais semelhantes (AB) sejam os mais 
próximos e os menos similares (AC) sejam os mais dis- 
tantes entre si. A Figura 9-2a contém um mapa percep- 
tual unidimensional que acomoda as ordens de pares. 
Se a pessoa que julga a similaridade entre os doces es- 
tivesse pensando em uma regra simples de similaridade 


que envolvesse apenas um atributo (dimensão), como 
quantia de chocolate, então todos os pares poderiam 
ser colocados em uma única escala que reproduzisse os 
valores de similaridades. 


Apesar de um mapa unidimensional poder acomodar 
quatro objetos, a tarefa se torna cada vez mais difícil à 
medida que o número de objetos aumenta. O leitor in- 
teressado é encorajado a tentar essa tarefa com seis ob- 
jetos. Quando uma única dimensão é empregada com os 
seis objetos, a ordenação real varia substancialmente em 
relação à ordenação original do respondente. 

Como o escalonamento unidimensional não ajusta 
bem os dados, uma solução bidimensional deve ser ten- 
tada. Isso permite que uma outra escala (dimensão) seja 
usada para configurar os doces. 


O procedimento é bastante tedioso para se tentar ma- 
nualmente. A solução bidimensional produzida por um 
programa MDS é mostrada na Figura 9-2b. Essa confi- 
guração combina exatamente com as ordens da Tabela 
9-1, apoiando a noção de que o respondente muito pro- 
vavelmente usou duas dimensões para avaliar os doces. 


A conjectura de que pelo menos dois atributos (dimen- 
(Continua) 


(a) Mapa perceptual unidimensional de quatro observações 


(6; D A B Dimensão | 
l l l I J 
-2 — 0 1 2 
Variável 


(b) Mapa perceptual bidimensional de seis observações 
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FIGURA 9-2 Mapas perceptuais unidimensional e bidimensional. 
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(Continuação) 
sões) foram considerados é baseada na incapacidade 


de representar as percepções do respondente em uma 
dimensão. No entanto, ainda não estamos cientes de 
quais atributos o respondente usou em sua avaliação. 


Interpretação dos eixos 


Apesar de não dispormos de informação a respeito de 
quais dimensões estamos usando, podemos olhar para as 
posições relativas dos doces e inferir quais atributos elas 
representam. 


Por exemplo, suponha que os doces A, Be F são uma 
forma de combinação (digamos, chocolate e amendoim, 
chocolate e manteiga de amendoim) e €, D e E são ape- 
nas chocolate. Poderíamos inferir então que a dimensão 
horizontal* representa o tipo de doce (chocolate puro 
versus combinação). Quando olhamos a posição das 
barras de doce na dimensão vertical**, outros atributos 
também podem emergir como os descritores daquela di- 
mensão. 


O MDS permite aos pesquisadores a compreensão so- 
bre a similaridade entre objetos (p.ex., doces) por meio da 
solicitação de somente percepções de similaridade geral. 
O procedimento também pode ajudar na determinação 
de quais atributos realmente entram nas percepções de si- 
milaridade. Apesar de não incorporarmos diretamente as 
avaliações de atributo no procedimento MDS, podemos 
usá-las em análises posteriores para auxiliar na interpre- 
tação das dimensões e dos impactos que cada atributo tem 
sobre as posições relativas dos doces. 


COMPARAÇÃO ENTRE MDS E OUTRAS 
TÉCNICAS DE INTERDEPENDENCIA 


O escalonamento multidimensional pode ser comparado 
com as outras técnicas de interdependência como análise 
fatorial e análise de agrupamentos com base em sua abor- 
dagem para definir estrutura: 


e Análise fatorial: Define estrutura reunindo variáveis em va- 
riáveis estatísticas que representam dimensões inerentes no 
conjunto original de variáveis. Variáveis que se correlacio- 
nam fortemente são agrupadas. 

e Análise de agrupamentos: Define estrutura reunindo objetos 
de acordo com seus perfis em um conjunto de variáveis (a 
variável estatística de agrupamento) no qual objetos muito 
próximos entre si são colocados juntos. 


O MDS difere das análises fatorial e de agrupamentos 
em dois aspectos-chave: (1) uma solução pode ser obtida 
para cada indivíduo, e (2) não é usada uma variável esta- 
tística. 


*N. de R.T.: O correto seria “dimensão vertical”. 
** N. de R. T.: O correto seria “dimensão horizontal”. 


Indivíduo como a unidade de análise 


Em MDS, cada respondente fornece avaliações de todos 
os objetos considerados, de forma que pode ser obtida 
uma solução para cada indivíduo, o que não é possível 
em análise de agrupamentos ou análise fatorial. Assim, 
o foco não está nos objetos em si, mas no modo como o 
indivíduo percebe os mesmos. A estrutura a ser definida 
é referente às dimensões perceptuais de comparação para 
o(s) indivíduo(s). Assim que as dimensões perceptuais são 
definidas, as comparações relativas entre objetos também 
podem ser feitas. 


Falta de uma variável estatística 


O escalonamento multidimensional, diferentemente das 
outras técnicas multivariadas, não emprega uma variável 
estatística. No lugar disso, as variáveis que formariam a 
variável estatística (isto é, as dimensões perceptuais de 
comparação) são inferidas a partir de medidas globais de 
similaridade entre os objetos. Em uma analogia simples, 
isso é como fornecer a variável dependente (similaridade 
entre objetos) e descobrir quais devem ser as variáveis in- 
dependentes (dimensões perceptuais). O MDS tem a van- 
tagem de reduzir a influência do pesquisador, uma vez que 
não requer a especificação das variáveis a serem usadas na 
comparação de objetos, como se faz em análise de agru- 
pamentos. Mas também tem a desvantagem de que o pes- 
quisador não está realmente certo sobre quais variáveis o 
respondente está usando para fazer as comparações. 


UMA ESTRUTURA DE DECISÃO PARA 
MAPEAMENTO PERCEPTUAL 


O mapeamento perceptual engloba uma vasta gama de 
possíveis métodos, incluindo MDS, e todas essas técnicas 
podem ser vistas por meio do processo de construção de 
modelo introduzido no Capítulo 1. Esses passos corres- 
pondem a uma estrutura de decisão, descrita nas Figuras 
9-3 (estágios 1-3) e 9-5 (estágios 4-6, ver página 498), den- 
tro da qual todas as técnicas de mapeamento perceptual 
podem ser aplicadas e os resultados, avaliados. 


ESTÁGIO 1: OBJETIVOS DO MDS 


O mapeamento perceptual, e o MDS em particular, é mui- 
to adequado para atingir dois objetivos: 


1. Como técnica exploratória, para identificar dimensões não- 
reconhecidas que afetam o comportamento 

2. Como um meio para obter avaliações comparativas de ob- 
jetos quando as bases específicas de comparação são desco- 
nhecidas ou indefinidas 


Em MDS não é necessário especificar os atributos de 
comparação para o respondente. Tudo o que se exige é es- 
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pecificar os objetos e garantir que eles compartilham uma 
base comum de comparação. Essa flexibilidade torna o 
MDS particularmente adequado para estudos de imagem 
e posicionamento nos quais as dimensões de avaliação po- 
dem ser muito globais ou muito emocionais e afetivas para 


serem medidas por escalas convencionais. Métodos MDS 
combinam o posicionamento de objetos e indivíduos em 
um único mapa geral, tornando as posições relativas de 
objetos e consumidores para uma análise de segmentação 
muito mais direta. 


Estágio 1 
Escolher objetivos: 


Problema de pesquisa 


Identificar dimensões avaliativas não-reconhecidas 
Avaliação comparativa de objetos 


Especificação de pesquisa 


Identificar todos os objetos relevantes 


Escolher entre dados de similaridade ou de preferência 
Selecionar uma análise desagregada ou agregada 


Estágio 2 Escolher uma abordagem para mapeamento perceptual 


Os atributos avaliativos são especificados pelo 
pesquisador (composicional) ou são usadas apenas 
medidas gerais de preferência (decomposicional)? 


Métodos composicionais 


Métodos gráficos/post hoc 
Técnicas multivariadas 


Métodos decomposicionais 
Técnicas tradicionais de escalonamento 


multidimensional 


Análise de correspondência 
Questões de planejamento de pesquisa 


E 


Número de objetos 
Dados de entrada métricos versus não-métricos 


Tipo de avaliação feita 


O respondente está descrevendo similaridades 
entre objetos, preferências entre os mesmos, 
ou uma combinação de ambas? 


Similaridades 


Comparação de pares de objetos 
Dados de confusão 
Medidas derivadas 


| 
Estágio 3 Suposições 
Dimensionalidade de avaliações pode variar por 
respondente 
Importância de dimensões avaliativas pode variar 
Avaliações não precisam ser estáveis ao longo do tempo 


Para 
o estágio 
4 


Preferências 
Ordenação direta 


Comparação aos pares e preferência 


FIGURA 9-3 Estágios 1-3 no diagrama de decisão do escalonamento multidimensional. 


Ambas as medidas, similaridade e preferência 
Combinação de medidas de similaridade 
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Decisões-chave para estabelecer objetivos 


A força do mapeamento perceptual é sua habilidade para 
inferir dimensões sem a necessidade de atributos defini- 
dos. A flexibilidade e a natureza inferencial do MDS atri- 
buem uma maior responsabilidade ao pesquisador para 
definir corretamente a análise. Considerações conceituais, 
bem como práticas, essenciais para que o MDS consiga 
seus melhores resultados, são tratadas através de três de- 
cisões-chave: 


1. Selecionar os objetos que serão avaliados 

2. Decidir se similaridades ou preferências devem ser analisa- 
das 

3. Escolher se a análise será realizada no grupo ou individual- 
mente. 


Identificação de todos os objetos 

relevantes a serem avaliados 

A questão mais básica, porém importante, no mapea- 
mento perceptual é a definição de objetos a serem ava- 
liados. O pesquisador deve garantir que todas as empre- 
sas, produtos, serviços ou outros objetos relevantes sejam 
incluídos, pois o mapeamento perceptual é uma técnica 
de posicionamento relativo. A relevância é determinada 
pelas questões de pesquisa a serem abordadas. 


Por exemplo, um estudo sobre refrigerantes deve incluir 
bebidas à base de açúcar e aquelas que não têm açúcar, a 
menos que a questão de pesquisa explicitamente exclua 
um tipo ou outro. Analogamente, um estudo de refrige- 
rantes não incluiria sucos de fruta. 


Os mapas perceptuais resultantes de qualquer um 
dos métodos podem ser fortemente influenciados tanto 
pela omissão de objetos quanto pela inclusão de objetos 
inadequados [7, 20]. Se objetos irrelevantes ou não-com- 
paráveis forem incluídos, o pesquisador estará forçando 
a técnica não apenas a inferir as dimensões perceptuais 
que distinguem objetos comparáveis, mas também a in- 
ferir as dimensões que diferenciam objetos não-compa- 
ráveis. Essa tarefa está além do escopo do MDS e re- 
sulta em uma solução que não trata adequadamente de 
nenhuma questão. Analogamente, a omissão de um ob- 
jeto relevante pode impedir a verdadeira descrição das 
dimensões perceptuais. 


Dados de similaridade versus dados de preferência 
Após ter selecionado os objetos para estudo, o pesqui- 
sador deve selecionar a base de avaliação: similaridade 
versus preferência. Até este ponto, discutimos o mapea- 
mento perceptual e o MDS principalmente em termos de 
julgamentos de similaridade. Ao fornecer dados de simi- 
laridades, o respondente não aplica aspecto “bom-ruim” 
de avaliação na comparação. A avaliação “bom-ruim” é 
feita, porém, dentro de dados de preferência, a qual assu- 


me que diferentes combinações de atributos percebidos 
são melhor avaliadas do que outras combinações. 

Ambas as bases de comparação podem ser usadas para 
desenvolver mapas perceptuais, mas com diferentes inter- 
pretações: 


e Mapas perceptuais baseados em similaridades representam 
similaridades de atributos e dimensões perceptuais de com- 
paração, mas não refletem qualquer idéia direta nos deter- 
minantes de escolha. 

e Mapas perceptuais baseados em preferência refletem es- 
colhas preferidas, mas não podem corresponder de forma 
alguma às posições baseadas em similaridades, porque os 
respondentes podem basear suas escolhas em dimensões ou 
critérios inteiramente diferentes daqueles nos quais eles ba- 
seiam as comparações. 


Sem qualquer base ótima para avaliação, a decisão en- 
tre similaridades e dados de preferência deve ser tomada 
com a questão de pesquisa definitiva em mente, pois essas 
opções são fundamentalmente diferentes em relação ao 
que representam. 


Análise agregada versus desagregada 

Ao considerar dados de similaridades ou de preferências, 
estamos coletando percepções de estímulos de respon- 
dentes e criando representações (mapas perceptuais) de 
proximidade de estímulos em espaço t-dimensional (onde 
o número de dimensões t é menor do que o número de 
estímulos). Em questão, porém, está o nível de análise (in- 
dividual ou em grupo) no qual os dados são analisados. 
Cada abordagem apresenta vantagens e desvantagens. 


Análise desagregada. Uma das características distintivas 
de técnicas MDS é sua habilidade de estimar soluções para 
cada respondente, um método conhecido como análise 
desagregada. Aqui o pesquisador gera mapas perceptuais 
em uma base sujeito-por-sujeito (produzindo tantos ma- 
pas quanto sujeitos). A vantagem é a representação dos 
elementos únicos das percepções de cada respondente. A 
principal desvantagem é que o pesquisador deve identi- 
ficar as dimensões comuns dos mapas perceptuais entre 
múltiplos respondentes. 


Análise agregada. Técnicas MDS também podem com- 
binar respondentes e criar um único mapa perceptual por 
meio de uma análise agregada. A agregação pode ocorrer 
antes ou depois de escalonar os dados dos sujeitos. Três 
abordagens básicas para este tipo de análise são agrega- 
ção antes da análise MDS, resultados individuais agrega- 
dos e INDSCAL. 


Agregação antes da análise MDS. A abordagem 
mais simples é o pesquisador encontrar as avaliações mé- 
dias para todos os respondentes e então obter uma úni- 
ca solução para o grupo de respondentes como um todo. 
É também o tipo mais comum de análise agregada. Para 
identificar subgrupos de respondentes semelhantes e seus 
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mapas perceptuais individuais, o pesquisador pode ana- 
lisar por agrupamento as respostas dos sujeitos para en- 
contrar alguns poucos sujeitos médios ou representativos 
e então desenvolver mapas para o “respondente médio” 
do agrupamento. 


Resultados individuais agregados. Alternativa- 
mente, o pesquisador pode desenvolver mapas para cada 
indivíduo e agrupar os mapas de acordo com as coorde- 
nadas dos estímulos nos mapas. Recomenda-se, porém, 
que a abordagem prévia de encontrar avaliações médias 
seja usada em vez de se agruparem os mapas perceptu- 
ais individuais, pois pequenas rotações do mapa, que é 
essencialmente o mesmo, podem causar problemas na 
criação de agrupamentos razoáveis pela segunda abor- 
dagem. 


INDSCAL: uma técnica de combinação. Uma for- 
ma especializada de análise agregada está disponível com 
INDSCAL (escalonamento de diferenças individuais) [4] 
e suas variantes, que têm características de análises de- 
sagregada e agregada. Uma análise INDSCAL assume 
que todos os indivíduos compartilham um espaço comum 
(uma solução agregada), mas que os respondentes indivi- 
dualmente ponderam as dimensões, incluindo pesos nu- 
los quando ignoram totalmente uma dimensão. A análise 
prossegue em dois passos: 


1. Como primeiro passo, INDSCAL obtém o espaço perceptu- 
al compartilhado por todos os indivíduos, como ocorre em 
outras soluções agregadas. 

2. No entanto, os indivíduos também são representados em um 
mapa especial de grupo, onde a posição do respondente é 
determinada por seu peso para cada dimensão. Responden- 
tes colocados próximos uns dos outros empregam combina- 
ções similares das dimensões do espaço agregado comum. 
Além disso, a distância do indivíduo à origem é uma medida 
aproximada da proporção de variância para aquele sujeito 
explicada pela solução. Assim, uma posição mais distante 
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da origem indica melhor ajuste. Estar na origem significa 
“sem ajuste”, pois todos os pesos são nulos. Se dois ou mais 
sujeitos ou grupos de sujeitos estão na origem, os espaços 
agregados separados precisam ser configurados para cada 
um deles. 


Como exemplo, consideremos que derivamos uma solu- 
ção agregada bidimensional (ver passo 1). INDSCAL de- 
riva também pesos para cada dimensão, o que permitiria 
para cada respondente ser retratado em um gráfico bidi- 
mensional (ver Figura 9-4). Para o respondente A, quase 
toda a solução foi orientada em torno da dimensão I, en- 
quanto o contrário foi percebido para o respondente €. 
Os respondentes B e D têm um equilíbrio entre as duas 
dimensões. 

Também determinamos o ajuste para cada respon- 
dente dado pela distância do mesmo à origem. Os res- 
pondentes A, Be C são relativamente semelhantes em 
suas distâncias da origem, indicando ajuste comparável. 
No entanto, o respondente D tem um nível substancial- 
mente menor de ajuste dado por sua grande proximidade 
da origem. 


Em uma análise INDSCAL, é apresentada ao pes- 
quisador não somente uma representação geral do mapa 
perceptual, mas também o grau em que cada respondente 
é representado pelo mapa perceptual geral. Esses resulta- 
dos para cada respondente podem então ser usados para 
agrupar respondentes e mesmo identificar diferentes ma- 
pas perceptuais em análises subsegiientes. 


Escolha entre uma análise desagregada e uma agregada. 
A escolha entre análise agregada e desagregada é baseada 
nos objetivos do estudo. Se o foco é uma compreensão das 
avaliações gerais de objetos e das dimensões empregadas 
em tais avaliações, uma análise agregada é mais adequada. 
Mas se o objetivo é entender a variação entre indivíduos, 
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FIGURA 9-4 Pesos de respondentes em uma análise desagregada INDSCAL. 
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REGRAS PRÁTICAS 9-1 


Objetivos do MDS 


e MDS é uma técnica exploratória adequada para: 

e Identificar dimensões não-reconhecidas usadas por 
respondentes para fazer comparações entre objetos 
(marcas, produtos, lojas etc.) 

Fornecer uma base objetiva para comparação entre 
objetos com base nessas dimensões 
Identificar atributos específicos que possam 
corresponder a essas dimensões 
e Uma solução MDS requer identificação de todos os 
objetos relevantes (p.ex., todas as marcas competidoras 
dentro de uma categoria de produto) que estabeleçam 
os limites para a questão de pesquisa 

Os respondentes fornecem um ou ambos os tipos de 

percepção: 

e Distâncias perceptuais que indiquem o quão 


semelhantes/distintos os objetos são entre si, ou 
Avaliações do tipo “bom-ruim” de objetos 
competidores (comparações de preferência) que 
auxiliam na identificação de combinações de 
atributos que são bem cotados 

MDS pode ser executado no nível individual ou em 


grupo: 
e Análise desagregada (individual): 
e Permite construção de mapas perceptuais em uma 
base respondente-por-respondente 
e Avalia variação entre indivíduos 
e Fornece uma base para análise de segmentação 
e Análise agregada (em grupo) 
Cria mapas perceptuais de um ou mais grupos 
Ajuda a entender avaliações gerais de objetos e/ 
ou dimensões empregadas nas mesmas 
Deve ser encontrada usando-se as avaliações 
médias de todos os respondentes em um grupo 


particularmente como prelúdio para a análise de segmen- 
tação, então uma abordagem desagregada é mais útil. 


ESTÁGIO 2: PROJETO DE 
PESQUISA DO MDS 


Apesar de o MDS parecer muito simples em termos com- 
putacionais, os resultados, assim como em outras técnicas 
multivariadas, são fortemente influenciados por diversas 
questões-chave que devem ser resolvidas antes que a pes- 
quisa possa prosseguir. Cobrimos quatro das principais 
questões, que variam de discussões sobre delineamento 
de pesquisa (seleção da abordagem e de objetos ou estí- 
mulos para estudo) até aspectos metodológicos específi- 
cos (métodos métricos versus não-métricos) e métodos de 
coleta de dados. 


Seleção entre uma abordagem 
decomposicional (livre de atributos) ou 
composicional (baseada em atributos) 


As técnicas de mapeamento perceptual podem ser classifi- 
cadas em um entre dois tipos conforme a natureza das res- 
postas obtidas a partir do indivíduo relativas ao objeto: 


e O método decomposicional mede apenas a impressão ou 
avaliação geral de um objeto e então tenta derivar posi- 
ções espaciais em um espaço multidimensional que reflitam 
tais percepções. Essa técnica normalmente é associada ao 
MDS. 

e O método composicional é uma abordagem alternativa que 
emprega diversas das técnicas multivariadas já discutidas 
que são usadas para formar uma impressão ou avaliação ba- 
seada em uma combinação de atributos específicos. 


Cada abordagem tem vantagens e desvantagens que 
abordamos nas seções a seguir. Nossa discussão aqui se 
concentra nas diferenças entre as duas abordagens, e em 
seguida focalizamos principalmente as técnicas decompo- 
sicionais no restante do capítulo. 


Abordagem decomposicional ou sem atributos 
Comumente associados às técnicas de MDS, os métodos 
decomposicionais se sustentam em medidas globais ou 
gerais de similaridade, a partir das quais os mapas per- 
ceptuais e os posicionamentos relativos de objetos são 
formados. Por conta da tarefa relativamente simples apre- 
sentada ao respondente, métodos decomposicionais têm 
duas vantagens distintas: 


1. Exigem apenas que os respondentes forneçam suas percep- 
ções gerais dos objetos. Os respondentes não têm que deta- 
lhar os atributos ou a importância de cada atributo usado na 
avaliação. 

2. Como cada respondente fornece uma avaliação completa de 
similaridades entre todos os objetos, os mapas perceptuais 
podem ser desenvolvidos para respondentes individuais ou 
agregados para formar um mapa composto. 


Os métodos decomposicionais também apresentam 
desvantagens, principalmente relacionadas com as infe- 
rências exigidas do pesquisador para avaliação dos mapas 
perceptuais: 


1. O pesquisador não dispõe de base objetiva fornecida pelo 
respondente para identificar as dimensões básicas de ava- 
liação dos objetos (isto é, a correspondência de dimensões 
perceptuais e objetivas). Em muitos casos, a utilidade de 
estudos livres de atributos para administradores é restrita, 
pois tais estudos fornecem pouca orientação para ação espe- 
cífica. Por exemplo, a falta de habilidade para desenvolver 
uma ligação direta entre ações da empresa (a dimensão ob- 
jetiva) e posições de mercado de seus produtos (a dimensão 
perceptual) muitas vezes diminui o valor do mapeamento 
perceptual. 

2. Pouca orientação, além de orientações generalizadas ou 
crenças a priori, está disponível para determinar a dimen- 
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sionalidade do mapa perceptual e a representatividade da 
solução. Apesar de algumas medidas gerais de ajuste esta- 
rem disponíveis, elas são não-estatísticas, e, assim, decisões 
sobre a solução final envolvem um substancial julgamento 
do pesquisador. 


Caracterizada pela categoria generalizada de técnicas 
MDS, uma vasta gama de possíveis técnicas decomposi- 
cionais está disponível. A seleção de um método específi- 
co requer decisões relativas à natureza dos dados do res- 
pondente (avaliação versus ordenação), se similaridades 
ou preferências são obtidas e se mapas perceptuais indi- 
viduais ou compostos são derivados. Entre os programas 
de escalonamento multidimensional mais comuns estão 
KYST, MDSCAL, PREFMAP, MDPREF, INDSCAL, 
ALSCAL, MINISSA, POLYCON e MULTISCALE. 
Descrições detalhadas dos programas e fontes para obtê- 
los estão disponíveis [23, 24]. 


Abordagem composicional ou 

baseada em atributos 

Os métodos composicionais incluem algumas das técnicas 
multivariadas mais tradicionais (p.ex., a análise discrimi- 
nante ou a análise fatorial), bem como métodos especifi- 
camente elaborados para mapeamento perceptual, como a 
análise de correspondência. Um princípio comum a todos 
esses métodos, porém, é a avaliação de similaridade, na 
qual um conjunto definido de atributos é considerado no 
desenvolvimento da similaridade entre objetos. As várias 
técnicas incluídas no conjunto de métodos composicionais 
podem ser agrupadas em uma de três categorias básicas: 


1. Abordagens gráficas ou post hoc. Incluídas nesta classe estão 
análises como gráficos diferenciais semânticos ou matrizes 
de importância-desempenho, que se sustentam no julgamen- 
to do pesquisador e em representações univariadas ou biva- 
riadas dos objetos. 

2. Técnicas estatísticas multivariadas convencionais. Estas técni- 
cas, especialmente a análise fatorial e a análise discriminante, 
são particularmente úteis no desenvolvimento de uma estru- 
tura dimensional entre numerosos atributos e na posterior 
representação de objetos quanto a essas dimensões. 

3. Métodos de mapeamento perceptual especializados. Notável 
nessa classe é a análise de correspondência, desenvolvida es- 
pecificamente para fornecer mapeamento perceptual apenas 
com dados em escala qualitativa ou nominal. 


Métodos composicionais em geral têm duas vantagens 
distintas oriundas de seus atributos definidos usados em 
comparação: 


e Primeiro, a descrição explícita das dimensões do espaço 
perceptual. Como o respondente fornece avaliações deta- 
lhadas em numerosos atributos para cada objeto, os crité- 
rios de avaliação representados pelas dimensões da solução 
são muito mais fáceis de se averiguar. 

e Além disso, essas técnicas fornecem um método direto para 
representar atributos e objetos em um só mapa, em que di- 
versas abordagens fornecem o posicionamento adicional de 


grupos de respondentes. Essa informação nos dá uma visão 
administrativa única do ambiente competitivo de mercado. 


No entanto, a descrição explícita das dimensões de com- 
paração também apresenta desvantagens: 


e A similaridade entre objetos é limitada somente aos atribu- 
tos avaliados pelos respondentes. Omitir atributos salientes 
elimina a oportunidade para o respondente de incorporá-los, 
como ocorreria se uma medida geral fosse usada. 

e O pesquisador deve assumir algum método de combinação 
desses atributos para representar a similaridade geral, e o 
método escolhido pode não representar o pensamento dos 
respondentes. 

e O esforço de coleta de dados é considerável, especialmente à 
medida que o número de objetos de escolha aumenta. 

e Osresultados raramente estão disponíveis para o responden- 
te individual. 


Ainda que modelos composicionais sigam o conceito 
de uma variável estatística descrita em muitas das outras 
técnicas multivariadas que discutimos em outras seções 
do texto, eles representam uma técnica bastante diferen- 
te, com vantagens e desvantagens quando comparados aos 
métodos decomposicionais. E uma escolha que o pesqui- 
sador deve fazer com base nas metas de pesquisa de cada 
estudo em particular. 


Seleção entre técnicas composicionais 

e decomposicionais 

O mapeamento perceptual pode ser executado com téc- 
nicas composicionais ou decomposicionais, mas cada uma 
tem vantagens e desvantagens específicas que devem ser 
consideradas do ponto de vista dos objetivos da pesquisa: 


e Se o mapeamento perceptual é empreendido no espírito de 
um dos dois objetivos básicos discutidos anteriormente (ver 
estágio 1), as abordagens decomposicionais ou livres de atri- 
butos são as mais apropriadas. 

e Se, contudo, os objetivos de pesquisa mudam para a retrata- 
ção de objetos em um conjunto definido de atributos, então 
as técnicas composicionais se tornam a alternativa preferida. 


Nossa discussão sobre os métodos composicionais em 
capítulos anteriores ilustrou seus usos e aplicações, junta- 
mente com suas forças e fraquezas. O pesquisador deve 
sempre se lembrar das alternativas disponíveis no caso de 
os objetivos da pesquisa se alterarem. Assim, concentra- 
mo-nos aqui nas abordagens decomposicionais, seguidas 
por uma discussão sobre a análise de correspondência, 
uma técnica composicional amplamente usada e particu- 
larmente adequada ao mapeamento perceptual. Como tal, 
também consideramos sinônimos os termos mapeamento 
perceptual e escalonamento multidimensional, a menos que 
distinções necessárias sejam feitas. 


Objetos: seu número e seleção 


Antes de iniciar qualquer estudo de mapeamento percep- 
tual, o pesquisador deve tratar de duas questões sobre os 
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objetos em avaliação. Tais questões lidam com aspectos 
relativos à tarefa básica (ou seja, a garantia de comparabi- 
lidade dos objetos), bem como a complexidade da análise 
(isto é, o número de objetos sob avaliação). 


Seleção de objetos 

A questão-chave na seleção de objetos é: os objetos são real- 
mente comparáveis? Uma suposição implícita em mapea- 
mento perceptual é que existem características em comum, 
sejam objetivas ou percebidas, que o respondente pode usar 
para avaliações. Portanto, é essencial que os objetos sob 
comparação tenham algum conjunto de atributos inerentes 
que caracterizem cada um deles e que formem a base para 
comparação por parte do respondente. Não é possível para 
o pesquisador forçar o respondente a fazer comparações 
pela criação de pares de objetos não-comparáveis. Ainda 
que as respostas sejam dadas em tal situação forçada, sua 
utilidade é questionável. 


O número de objetos 

Uma segunda questão lida com a quantia de objetos a se- 
rem avaliados. Ao decidir quantos objetos serão incluídos, 
o pesquisador deve equilibrar dois desejos: um menor nú- 
mero de objetos para facilitar o esforço por parte do res- 
pondente versus o número exigido de objetos para obter 
uma solução multidimensional estável. Essas considerações 
opostas impõem limites sobre a análise: 


e Uma orientação sugerida para soluções estáveis é ter mais do 
que quatro vezes a quantia de objetos em relação ao número 
de dimensões desejadas [9]. Assim, pelo menos cinco objetos 
são exigidos para um mapa perceptual unidimensional, nove 
objetos são exigidos para uma solução bidimensional, e assim 
por diante. 

e Quando usamos o método para avaliação de pares em termos 
de similaridade, o respondente deve fazer 36 comparações dos 
nove objetos — uma tarefa considerável. Uma solução tridi- 
mensional demanda pelo menos 13 objetos a serem avaliados 
e necessita da avaliação de 78 pares de objetos. 


Portanto, uma comparação deve ser feita, ponderando- 
se a dimensionalidade acomodada pelos objetos (e o conse- 
quente número de dimensões inerentes que podem ser iden- 
tificadas) e o esforço exigido por parte do respondente. 

O número de objetos também afeta a determinação de 
um nível aceitável de ajuste. Muitas vezes, ter menos do 
que a quantia de objetos sugerida para uma dada dimen- 
sionalidade provoca uma estimativa exagerada de ajuste. 
Semelhante ao problema de superajuste que encontramos 
em regressão, ficar abaixo da orientação recomendada de 
pelo menos quatro objetos por dimensão aumenta muito as 
chances de uma solução enganosa. 


Por exemplo, um estudo empírico demonstrou que 
quando sete objetos são ajustados a três dimensões com 
valores de similaridade aleatórios, níveis de desajuste 


aceitáveis e mapas perceptuais aparentemente válidos 
são gerados em mais de 50% das vezes. Se os sete obje- 
tos com similaridades aleatórias são ajustados a quatro 
dimensões, os valores de desajuste decaem para zero, in- 
dicando ajuste perfeito, em metade dos casos [18]. Mes- 
mo assim, nas duas situações, não havia qualquer padrão 
real de similaridade entre os objetos. 


Portanto, devemos estar cientes dos riscos associa- 
dos com a violação das orientações para o número de 
objetos por dimensão e do impacto que isso tem sobre 
as medidas de ajuste e a validade dos mapas perceptuais 
resultantes. 


Métodos não-métricos versus métricos 


Os programas MDS originais eram verdadeiramente 
não-métricos, o que significa que exigiam apenas dados 
não-métricos, mas também forneciam apenas resultados 
não-métricos (ordenação). O resultado não-métrico, po- 
rém, limitava a interpretabilidade do mapa perceptual. 
Portanto, todos os programas MDS usados hoje em dia 
produzem saídas métricas. As posições multidimensio- 
nais métricas podem ser rotacionadas em torno da ori- 
gem, a origem pode ser transladada pelo acréscimo de 
uma constante, os eixos podem ser trocados (reflexão) ou 
a solução inteira pode ser uniformemente expandida ou 
comprimida, tudo isso sem alterar as posições relativas 
dos objetos. 

Como todos os programas atuais produzem saídas 
métricas, as distinções nas abordagens são baseadas nas 
medidas de similaridade. 


e Métodos não-métricos, diferenciados pelos dados não- 
métricos normalmente gerados pela ordenação de pares de 
objetos, são mais flexíveis, no sentido de que não assumem 
qualquer tipo específico de relação entre a distância calcu- 
lada e a medida de similaridade. No entanto, como os mé- 
todos não-métricos contêm menos informação para criar o 
mapa perceptual, têm maior probabilidade de resultar em 
soluções degeneradas ou subótimas. Esse problema surge 
quando existem grandes variações nos mapas perceptuais 
entre respondentes ou quando as percepções entre objetos 
não são distintas ou bem definidas. 

e Os métodos métricos consideram que tanto dados quanto 
saídas são métricos. Essa suposição permite fortalecer a re- 
lação entre a dimensionalidade final resultante e os dados 
de entrada. Melhor do que assumir que apenas relações or- 
denadas são preservadas nos dados de entrada, podemos 
assumir que o resultado preserva as qualidades de intervalo 
e de proporção desses dados. Mesmo que as suposições ine- 
rentes aos programas métricos sejam mais difíceis de apoiar 
conceitualmente em muitos casos, os resultados de proce- 
dimentos não-métricos e métricos aplicados aos mesmos 
dados frequentemente são semelhantes. 


Logo, a seleção do tipo de dados de entrada deve con- 
siderar tanto a situação de pesquisa (variações de percep- 
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ções entre respondentes e distinção entre objetos) quanto 
o modo preferido de coleta de dados. 


Coleta de dados de similaridade 
ou de preferência 


Como já observado, a distinção fundamental entre os pro- 
gramas MDS é o tipo de dado (métrico versus não-métri- 
co) e se os dados representam similaridades ou preferên- 
cias. Aqui abordamos questões associadas a julgamentos 
baseados em similaridades e em preferência. Para muitos 
dos métodos de coleta de dados, tanto dados métricos 
(avaliações) quanto não-métricos (ordenações) podem 
ser coletados. Em alguns casos, porém, as respostas são 
limitadas a apenas um tipo de dados. 


Dados de similaridades 

Quando coleta dados de similaridades, o pesquisador 
está tentando determinar quais itens são os mais pare- 
cidos uns com os outros e quais são os mais diferentes. 
Os termos de dissimilaridade e similaridade muitas vezes 
são empregados alternadamente para representar me- 
didas das diferenças entre objetos. Implícita na medida 
de similaridade está a habilidade de comparar todos os 
pares de objetos. 


Se, por exemplo, todos os pares de objetos do conjunto 
A,B,C (ou seja, AB, AC, BC) são ordenados, então to- 
dos os pares de objetos também podem ser comparados. 
Considere que os pares foram ordenados AB = 1, AC = 
2e BC=3 (onde 1 denota maior similaridade). Eviden- 
temente, o par AB é mais similar do que AC, o par AB 
é mais similar do que BC, e o par AC é mais similar do 
que BC. 


Diversos procedimentos são comumente empre- 
gados para obter percepções de respondentes quanto 
a similaridades entre estímulos. Cada procedimento é 
baseado na noção de que as diferenças relativas entre 
qualquer par de estímulos devem ser medidas de forma 
que o pesquisador possa determinar se o par é mais ou 
menos similar do que qualquer outro par. Discutimos 
três procedimentos normalmente usados para obter 
percepções de respondentes quanto a similaridades: 
comparações de pares de objetos, dados de confusão e 
medidas derivadas. 


Comparação de pares de objetos. Com larga vanta- 
gem, o método mais usado para obter julgamentos de 
similaridades é o de pares de objetos, no qual o respon- 
dente é solicitado a simplesmente ordenar ou avaliar a 
similaridade de todos os pares de objetos. Se temos es- 
tímulos A, B, €, D e E, podemos ordenar os pares AB, 
AC, AD, AE, BC, BD, BE, CD, CE e DE do mais ao 
menos similar. 


Se, por exemplo, o par AB é ordenado como 1, consi- 
deraríamos que o respondente vê aquele par como con- 
tendo os dois estímulos que são os mais similares, em 
comparação com todos os demais pares (ver exemplo na 
seção anterior). 


Esse procedimento forneceria uma medida não-mé- 
trica de similaridade. Medidas métricas de similaridade 
envolveriam uma avaliação de similaridade (p.ex., de 1 
“muito similar” a 10 “nada semelhante”). Qualquer for- 
ma (métrica ou não-métrica) pode ser usada na maioria 
dos programas MDS. 


Dados de confusão A medida de similaridade por pa- 
reamento (ou confusão) do estímulo 1 com o estímulo J é 
conhecida como dados de confusão. Também conhecido 
como agrupamento subjetivo, um procedimento típico 
para reunir esses dados quando o número de objetos é 
grande segue abaixo: 


e Colocar os objetos cuja similaridade deve ser medida em 
pequenos cartões, de maneira descritiva ou com imagens. 

e O respondente é solicitado a ordenar os cartões em pilhas, 
de forma que todos os cartões de uma pilha representem 
doces semelhantes. Alguns pesquisadores dizem aos res- 
pondentes para ordenar em um número fixo de pilhas; ou- 
tros dizem para ordenar em quantas pilhas o respondente 
quiser. 

e Os dados de cada respondente são então agregados em uma 
matriz de similaridades parecida com uma tabela de tabu- 
lação cruzada. Cada célula contém o número de vezes que 
cada par de objetos foi incluído na mesma pilha. Esses da- 
dos indicam quais produtos apareceram juntos com maior 
frequência e, por isso, são considerados os mais similares. 


A coleta de dados dessa maneira permite apenas o 
cálculo de similaridades agregadas, pois as respostas de 
todos os indivíduos são combinadas para obter a matriz 
de similaridades. 


Medidas derivadas. Similaridades baseadas em escores 
dados a estímulos por respondentes são conhecidas como 
medidas derivadas. O pesquisador define as dimensões 
(atributos) e o respondente avalia cada objeto em cada di- 
mensão. A partir dessas avaliações a similaridade de cada 
objeto é calculada por métodos como a correlação entre 
objetos ou alguma forma de índice de concordância. 


Por exemplo, sujeitos são solicitados a avaliar três es- 
tímulos (refrigerante de cereja, morango e lima-limão) 
quanto a alguns atributos (diet versus normal, doce ver- 
sus azedo, sabor leve versus sabor forte), usando escalas 
diferenciais semânticas. As respostas são avaliadas para 
cada respondente (p.ex., correlação ou índice de con- 
cordância) para criar medidas de similaridade entre os 
objetos. 
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Três suposições importantes estão presentes nesta 
abordagem: 


1. O pesquisador seleciona as dimensões adequadas à medi- 
da. 

2. As escalas podem ser ponderadas (por igual ou não) para 
conseguir os dados de similaridades para um sujeito ou gru- 
po de sujeitos. 

3. Todos os indivíduos têm os mesmos pesos. 


Dentre os três procedimentos que discutimos, a medi- 
da derivada é a menos desejável para atender ao espírito 
de MDS — de que a avaliação de objetos seja feita com a 
mínima influência por parte do pesquisador. 


Dados de preferência 

A preferência implica que os estímulos devem ser julgados 
em termos de relações de predomínio; ou seja, os estímu- 
los são ordenados em termos da preferência por alguma 
propriedade. Ela permite ao pesquisador fazer afirmações 
diretas sobre qual o objeto preferido (p.ex., a marca A é 
preferida em relação à C). Os dois procedimentos mais 
comuns para obter dados de preferência são a ordenação 
direta e a comparação aos pares. 


Ordenação direta. Cada respondente ordena os objetos 
do mais preferido ao menos preferido. Esse é um método 
muito popular para reunir dados de similaridades não- 
métricos, pois é fácil administrar para um número peque- 
no ou moderado de objetos. É conceitualmente muito pa- 
recido com a técnica de agrupamento subjetivo discutida 
anteriormente, só que nesse caso a cada objeto deve ser 
dada uma ordem única (sem empates). 


Comparações aos pares. Um respondente é defrontado 
com todos os possíveis pares e solicitado a indicar qual 
membro de cada par é preferido. Assim, preferência geral 
é baseada no número total de vezes que cada objeto foi o 
membro preferido da comparação pareada. Desse modo, 
o pesquisador reúne dados explícitos para cada compara- 
ção. Esta abordagem cobre todas as possíveis combina- 
ções e é muito mais detalhada do que apenas as ordena- 
ções diretas. A principal desvantagem desse método é o 
grande número de tarefas envolvidas, mesmo com uma 
quantia relativamente pequena de objetos. Por exemplo, 
10 objetos resultam em 45 comparações aos pares, o que 
representa muitas tarefas para a maioria das situações de 
pesquisa. Note que as comparações aos pares também são 
usadas na coleta de dados de similaridades, como obser- 
vado no exemplo do início do capítulo, mas lá os pares 
de objetos são ordenados ou avaliados quanto ao grau de 
similaridade entre os dois objetos no par. 


Dados de preferência versus 

dados de similaridade 

Tanto os dados de similaridade quanto os de preferên- 
cia fornecem uma base para a construção de um mapa 
perceptual que pode retratar as posições relativas dos 
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Planejamento de pesquisa de MDS 


e Mapas perceptuais podem ser gerados através de 
abordagens decomposicionais ou composicionais: 

e Abordagens decomposicionais são o método 
MDS mais tradicional e comum, exigindo apenas 
comparações gerais de similaridade entre objetos 
Abordagens composicionais são usadas quando os 
objetivos de pesquisa envolvem a comparação de 
objetos em um conjunto definido de atributos 

e O número de objetos a ser avaliado é uma decisão 
ponderada entre: 

e Um pequeno número de objetos para facilitar a 
tarefa do respondente 
Um número de objetos quatro vezes maior do que 
o de dimensões desejadas (ou seja, cinco objetos 
por uma dimensão, 9 objetos por duas dimensões, e 
assim por diante) para obter uma solução estável 


objetos através de dimensões percebidas (inferidas). A 
escolha entre as duas técnicas depende dos objetivos a 
serem alcançados: 


e Mapas perceptuais baseados em similaridade são mais ade- 
quados para compreender os atributos/dimensões que des- 
crevem os objetos. Nesta técnica, o foco está na caracteri- 
zação da natureza de cada objeto e da sua composição em 
relação aos demais. 

e Dados de preferência permitem ao pesquisador ver a loca- 
lização de objetos em um mapa perceptual no qual a distân- 
cia implica diferenças de preferência. Esse procedimento é 
útil porque a percepção de um indivíduo quanto a objetos 
em um contexto de preferência pode ser diferente daquela 
em um contexto de similaridade. Isto é, uma dimensão em 
particular pode ser útil na descrição das semelhanças entre 
dois objetos, mas pode não ser identificada como resultado 
na determinação de preferência. 


As diferentes bases para comparação nas duas técnicas 
muitas vezes resultam em mapas perceptuais muito distin- 
tos. Dois objetos podem ser percebidos como diferentes 
em um mapa baseado em similaridades, mas serem seme- 
lhantes em um mapa baseado em preferências, resultando 
em dois mapas bem diferentes. Por exemplo, duas marcas 
distintas de doce poderiam estar bem distantes em um 
mapa de similaridades, mas, por terem preferência equi- 
valente, ficarem próximas uma da outra em um mapa de 
preferência. O pesquisador deve escolher o mapa que me- 
lhor atende às metas da análise. 


Resumo 

Os procedimentos de coleta para dados de similaridades e 
de preferência têm o propósito em comum de obter uma 
série de respostas unidimensionais que representem os 
julgamentos dos respondentes. Esses julgamentos então 
servem como dados de entrada para os muitos procedi- 
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mentos MDS que definem o padrão multidimensional ine- 
rente que leva a tais julgamentos. 


ESTÁGIO 3: SUPOSIÇÕES 
DA ANÁLISE DE MDS 


O escalonamento multidimensional não tem suposições 
restritivas sobre a metodologia, tipo de dados ou forma 
das relações entre as variáveis, mas o MDS exige que o 
pesquisador aceite três princípios fundamentais sobre 
percepção: 


1. Variação em dimensionalidade. Os respondentes podem va- 
riar na dimensionalidade que eles usam para formar suas 
percepções sobre um objeto (apesar de se imaginar que a 
maioria das pessoas julga em termos de um número limi- 
tado de características ou dimensões). Por exemplo, alguns 
poderiam avaliar um carro em termos de sua potência e apa- 
rência, ao passo que outros não considerariam esses fatores 
de forma alguma, mas o avaliariam em termos de custo e 
conforto interior. 

2. Variação em importância. Os respondentes não precisam 
associar o mesmo nível de importância a uma dimensão, 
mesmo que todos os respondentes percebam essa dimensão. 
Por exemplo, dois respondentes percebem um refrigerante 
em termos de seu nível de gás, mas um pode considerar essa 
dimensão sem importância enquanto outro pode considerá- 
la muito relevante. 

3. Variação no tempo. Os julgamentos de um estímulo em ter- 
mos de dimensões ou níveis de importância não precisam 
permanecer estáveis com o tempo. Em outras palavras, não 
se pode esperar que os respondentes mantenham as mesmas 
percepções durante longos períodos. 


Apesar das diferenças que podemos esperar entre in- 
divíduos, os métodos MDS podem representar as percep- 
ções espacialmente, de modo que todas essas diferenças 
sejam acomodadas. Tal capacidade permite que técnicas 
MDS não apenas ajudem o pesquisador a entender cada 
indivíduo em separado, mas também a identificar percep- 
ções compartilhadas e avaliar dimensões dentro da amos- 
tra de respondentes. 


ESTÁGIO 4: DETERMINAÇÃO DA 
SOLUÇÃO MDS E AVALIAÇÃO 
DO AJUSTE GERAL 


Hoje em dia, os programas MDS básicos disponíveis em 
todos os principais programas estatísticos podem acomo- 
dar os diferentes tipos de dados de entrada e de repre- 
sentações espaciais, bem como as variadas alternativas 
de interpretação. Nossa meta aqui é fornecer uma visão 
geral do MDS para viabilizar uma rápida compreensão 
das diferenças entre esses programas. No entanto, como 
acontece com outras técnicas multivariadas, existe um 
desenvolvimento contínuo em aplicações e teoria. Assim, 


indicamos para o usuário interessado em aplicações espe- 
cíficas outros textos dedicados somente ao escalonamento 
multidimensional [9, 10, 16, 18,23]. 


Determinação da posição de um 
objeto no mapa perceptual 


A primeira tarefa do estágio 4 envolve o posicionamento 
de objetos para melhor refletir as avaliações de similarida- 
des fornecidas pelos respondentes (ver Figura 9-5). Aqui 
as técnicas MDS determinam as localizações ótimas para 
cada objeto em uma dimensionalidade especificada. As 
soluções para cada dimensionalidade (duas dimensões, 
três etc.) são então comparadas para a escolha de uma so- 
lução final que define o número de dimensões e a posição 
relativa de cada objeto em tais dimensões. 


Criação do mapa perceptual 

Os programas MDS seguem um processo em comum de 
três passos para determinar as posições ótimas em uma 
dimensionalidade escolhida: 


1. Selecione uma configuração inicial de estímulos (S,) em 
uma dimensionalidade inicial desejada (t). Há várias opções 
disponíveis para se obter a configuração inicial. As duas 
mais usadas são configurações aplicadas pelo pesquisador 
com base em dados prévios ou aquelas geradas pela seleção 
de pontos pseudo-aleatórios de uma distribuição multiva- 
riada aproximadamente normal. 

2. Compute as distâncias entre os pontos de estímulos e com- 
pare as relações (observadas versus obtidas) com uma me- 
dida de ajuste. Logo que uma configuração é encontrada, as 
distâncias entre estímulos (d,) nas configurações iniciais são 
comparadas com medidas de distância (d ) obtidas a partir 
de julgamentos de similaridades (s,). As duas medidas de 
distância são então comparadas por uma medida de ajus- 
te, normalmente uma medida de desajuste. (As medidas de 
ajuste são discutidas em uma seção posterior.) 

3. Se a medida de desajuste não atender a um valor de parada 
pré-definido, encontre uma nova configuração para a qual a 
medida de desajuste seja ainda mais minimizada. O progra- 
ma determina as direções nas quais o maior melhoramento 
pode ser conseguido e então desloca os pontos na configura- 
ção naquelas direções com pequenos incrementos. 


A necessidade de um programa de computador em vez 
de cálculos manuais se torna evidente quando o número 
de objetos e dimensões aumenta. Examinemos uma típica 
análise MDS e vejamos o que realmente está envolvido. 


Com 10 produtos a serem avaliados, cada respondente 
deve ordenar os 45 pares de objetos possíveis do mais si- 
milar (1) ao menos semelhante (45). Com essas ordena- 
ções, prosseguimos com a tentativa de definir a dimen- 
sionalidade e as posições de cada objeto. 


1. Primeiro, considere que estamos começando com 
uma solução bidimensional. Apesar de podermos 


definir qualquer número de dimensões, é mais fácil 
(Continua) 
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estágio 
3 


Estágio 4 Seleção da base para o mapa perceptual 


O mapa representa percepções 
de similaridade ou de preferência? 


Preferência 


Similaridade 


T 


Mapas perceptuais baseados em preferência — 


Preferência refletida pela posição de objetos 
diante de com pontos ideais 


Mapas perceptuais baseados em similaridade 


Posições relativas de objetos refletem 
similaridade sobre dimensões percebidas 


| 


Estimação do mapa perceptual 


Dados de entrada agregados ou desagregados: 
KYsT ALSCAL 
INDSCAL MINISSA 
POLYCON MULTISCALE 


Análise interna 


Estimar um mapa perceptual com pontos 
ideais estritamente a partir de dados de 
preferência usando MDPREF ou MDSCAL 


Análise externa 


Passo 1: Estimar um mapa perceptual 
baseado em similaridade 

Passo 2: Posicionar pontos ideais no 
mapa perceptual com PREMAP 


Seleção da dimensionalidade do mapa perceptual 


Inspeção visual a 
Medida de desajuste 
Indice de ajuste 


Estágio 5 Identificação das dimensões 


Procedimentos subjetivos 
Procedimentos objetivos 


Estágio 6 Validação dos mapas perceptuais 


Uso de amostras particionadas ou multi-amostras 
Convergência de resultados decomposicionais 
e composicionais 


FIGURA 9-5 Estágios 4-6 no diagrama de decisões do escalonamento multidimensional. 
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(Continuação) 
visualizar o processo em uma situação simples de 


duas dimensões. 

2. Coloque os 10 pontos (que representam os 10 pro- 
dutos) aleatoriamente em um gráfico impresso (re- 
presentando as duas dimensões) e então meça as 
distâncias entre cada par de pontos (45 distâncias). 

3. Calcule a qualidade de ajuste da solução medindo a 
concordância de ordenação entre as distâncias eu- 
clidianas (comprimento de segmentos de reta) dos 
objetos colocados no gráfico e as 45 ordenações ori- 
ginais. 

4. Se as distâncias em segmentos retos não concordam 
com as ordenações originais, mova os 10 pontos e 
tente novamente. Continue a mover os objetos até 
você conseguir um ajuste satisfatório entre as dis- 
tâncias entre todos os objetos e as ordenações indi- 
cativas de similaridade. 

5. Você pode então posicionar os 10 objetos em um 
espaço tridimensional e seguir o mesmo processo. 
Se o ajuste de distâncias reais com os postos de si- 
milaridade for melhor, então a solução tridimensio- 
nal pode ser mais adequada. 


Como o leitor pode perceber, o processo rapidamen- 
te se torna intratável quando o número de objetos e de 
dimensões aumenta. Computadores executam os cálculos 
e viabilizam uma solução mais precisa e detalhada. O pro- 
grama calcula a melhor solução sobre qualquer número 
de dimensões, fornecendo assim uma base de comparação 
entre várias soluções. 

O principal critério em todos os casos para encontrar a 
melhor representação dos dados é a preservação da rela- 
ção ordenada entre os dados de postos originais e as dis- 
tâncias obtidas entre pontos. Qualquer medida de ajuste 
(p.ex., desajuste) é simplesmente uma medida do quanto 
os postos baseados nas distâncias no mapa concordam (ou 
não) com as ordenações dadas pelos respondentes. 


Prevenção contra soluções degeneradas 

Ao avaliar um mapa perceptual, o pesquisador sempre 
deve estar ciente das soluções degeneradas. Soluções 
degeneradas são mapas perceptuais obtidos que não são 
representações precisas das respostas de similaridade. 
Quase sempre são provocadas por inconsistências nos 
dados ou por uma falta de habilidade do programa MDS 
em alcançar uma solução estável. Geralmente são carac- 
terizadas por um padrão circular no qual todos os objetos 
são mostrados como igualmente semelhantes, ou por uma 


solução agrupada na qual os objetos são agregados em 
dois extremos de uma só dimensão. Em ambos os casos, o 
MDS é incapaz de diferenciar os objetos por algum moti- 
vo. O pesquisador deve então reexaminar o delineamento 
da pesquisa para ver onde as inconsistências ocorrem. 


Seleção da dimensionalidade 
do mapa perceptual 


Como visto na seção anterior, o MDS define o mapa per- 
ceptual ótimo em várias soluções de diversas dimensiona- 
lidades. Com estas soluções em mãos, o objetivo do próxi- 
mo passo é a seleção de uma configuração espacial (mapa 
perceptual) em um número especificado de dimensões. A 
determinação de quantas dimensões estão realmente re- 
presentadas nos dados geralmente é conseguida por meio 
de uma entre três abordagens: avaliação subjetiva, gráficos 
scree das medidas de desajuste, ou índice geral de ajuste. 


Avaliação subjetiva 

O mapa espacial é um bom ponto de partida para a ava- 
liação. O número de mapas necessário à interpretação de- 
pende do número de dimensões. Um mapa é produzido 
para cada combinação de dimensões. Um objetivo do pes- 
quisador deve ser o de obter o melhor ajuste com o menor 
número possível de dimensões. A interpretação de solu- 
ções obtidas em mais de três dimensões é extremamente 
difícil e geralmente não compensa a melhoria no ajuste. 
O pesquisador normalmente faz uma avaliação subjetiva 
dos mapas perceptuais e determina se a configuração pa- 
rece razoável. Essa avaliação é importante porque, em um 
estágio posterior, as dimensões precisarão ser interpreta- 
das e explicadas. 


Medidas de desajuste 

Uma segunda abordagem é usar uma medida de desajus- 
te, a qual indica a proporção da variância das disparidades 
(diferenças em distâncias entre objetos no mapa percep- 
tual e os julgamentos de semelhança dos respondentes) 
não explicadas pelo modelo MDS. Essa medida varia de 
acordo com o tipo de programa e os dados analisados. O 
desajuste de Kruskal [17] é a medida mais comumente 
usada para determinar uma adequação de ajuste do mo- 
delo. Ele é definido por: 


Desajuste = 
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onde 


d = distância média (Edij/m no mapa 
dij = distância obtida do mapa perceptual 


d. = distância original baseada em julgamentos 
Y de similaridade 


O valor de desajuste se torna menor à medida que as 
d ; estimadas se aproximam das d, originais. O desajuste 
é minimizado quando os objetos são colocados em uma 
configuração, de modo que as distâncias entre os objetos 
combinem melhor com as distâncias originais. 

No entanto, um problema encontrado ao usar o desa- 
juste é análogo ao de Rºem regressão múltipla, no sentido 
de que o desajuste sempre melhora quando aumentam 
as dimensões. (Lembre-se que Rº sempre aumenta com 
variáveis adicionais.) Assim, um equilíbrio deve ser feito 
entre o ajuste da solução e o número de dimensões. Como 
foi feito para a extração de fatores em análise fatorial, 
podemos representar graficamente o valor de desajuste 
versus o número de dimensões para determinar o melhor 
número de dimensões a ser utilizado na análise [18]. 


Por exemplo, no gráfico scree na Figura 9-6, a quebra 
indica que há uma melhora substancial na qualidade de 
ajuste quando o número de dimensões aumenta de 1 
para 2. Portanto, o melhor ajuste é conseguido com uma 
quantia relativamente pequena (2) de dimensões. 


Índice de ajuste 
Um índice de correlação quadrada às vezes é usado como 
índice de ajuste. Ele pode ser interpretado como indicati- 
vo da proporção de variância das disparidades explicada 
pelo procedimento MDS. Em outras palavras, é uma me- 
dida do quanto os dados originais se ajustam ao modelo 
MDS. 

A medida Rº em escalonamento multidimensional 
representa essencialmente a mesma medida de variân- 
cia que ocorre com outras técnicas multivariadas. Logo, 


é possível usar critérios de medida semelhantes. Ou 
seja, medidas de 0,60 ou melhores que isso são consi- 
deradas aceitáveis. Naturalmente, quanto maior o RE 
melhor o ajuste. 


Incorporação de preferências ao MDS 


Até este ponto, nos concentramos em desenvolver mapas 
perceptuais baseados em julgamentos de similaridade. No 
entanto, mapas perceptuais também podem ser obtidos a 
partir de preferências. A meta é determinar a combinação 
preferida de características para um conjunto de estímulos 
que preveja preferência, dada uma configuração de obje- 
tos [8, 9]. Ao se fazer isso, cria-se um espaço conjunto que 
representa tanto os objetos (estímulos) quanto os sujeitos 
(pontos ideais). Uma suposição crítica é a homogeneidade 
de percepção ao longo dos indivíduos para o conjunto de 
objetos. Essa homogeneidade permite que todas as dife- 
renças sejam atribuídas a preferências, e não a diferenças 
perceptuais. 


Pontos ideais 

O termo ponto ideal tem sido mal compreendido ou en- 
ganoso algumas vezes. Podemos considerar que se loca- 
lizamos (no mapa perceptual obtido) o ponto que repre- 
senta a combinação preferida de atributos percebidos, 
identificamos a posição de um objeto ideal. Igualmente, 
podemos considerar que a posição desse ponto ideal (re- 
lativa aos outros produtos no mapa perceptual derivado) 
define preferências relativas de forma que produtos mais 
distantes do ideal devem ser menos preferidos. Assim, 
um ponto ideal é posicionado de maneira que a distância 
do ideal transmita mudanças em preferência. 


Considere, por exemplo, a Figura 9-7. Quando os dados 
de preferência sobre os seis doces (A a F) foram obti- 
dos de um respondente, o ponto ideal deles (indicado 
pelo ponto) foi posicionado de maneira que o aumento 


da distância do mesmo indicava preferência em declínio. 
(Continua) 
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FIGURA 9-6 Uso de um gráfico scree para determinar a dimensionalidade adequada. 
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e Indica ponto ideal do respondente 


FIGURA 9-7 Ponto ideal de um respondente dentro do mapa perceptual. 


(Continuação) 
Com base neste mapa perceptual, a ordem de preferên- 


cia desse respondente é C, F, D, E, 4, B. Deduzir que 
o doce ideal está exatamente naquele ponto ou mesmo 
além dele (na direção mostrada pela linha tracejada a 
partir da origem) pode ser enganoso. O ponto ideal sim- 
plesmente define a relação de preferência ordenada (do 
mais preferido ao menos) no conjunto de seis doces para 
aquele respondente. 


Apesar de os pontos ideais não poderem oferecer mui- 
ta perspectiva individualmente, agrupamentos deles po- 
dem ser úteis para definir segmentos. Muitos responden- 


Dimensão Il 


tes com pontos ideais na mesma área geral representam 
segmentos de mercado potenciais de pessoas com prefe- 
rências semelhantes, como indicado na Figura 9-8. 


Determinação de pontos ideais 

Duas abordagens geralmente funcionam para determinar 
pontos ideais: estimação explícita e implícita. A principal 
diferença entre as duas técnicas é o tipo de resposta ava- 
liativa requisitada ao respondente. Discutimos cada abor- 
dagem nas seções a seguir. 


Estimação explícita. A estimação explícita provém de 
respostas diretas de sujeitos, tipicamente pedindo-se ao 


E Dimensão | 


e Indica o ponto ideal de um respondente 


FIGURA 9-8 


Incorporação de múltiplos pontos ideais no mapa perceptual. 
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sujeito que avalie um ideal hipotético sobre os mesmos 
atributos nos quais os outros estímulos são avaliados. Al- 
ternativamente, o respondente é solicitado a incluir, entre 
os estímulos usados para reunir dados de similaridade, um 
estímulo ideal hipotético (p.ex., marca, imagem). 

Quando pedimos para respondentes conceituarem um 
ideal de algo, geralmente enfrentamos problemas. Fre- 
quentemente o respondente conceitua o ideal nos extre- 
mos das avaliações explícitas usadas ou como similares ao 
produto preferido entre aqueles com os quais o respon- 
dente tem experiência. Além disso, o respondente deve 
pensar em termos não de similaridades, mas de preferên- 
cias, o que costuma ser difícil com objetos relativamente 
desconhecidos. Muitas vezes, esses problemas perceptuais 
levam o pesquisador a usar a estimação implícita de ponto 
ideal. 


Estimação implícita. Diversos procedimentos para po- 
sicionar pontos ideais implicitamente são descritos na 
próxima seção. A suposição básica inerente à maioria dos 
procedimentos é que as medidas obtidas de posições espa- 
ciais de pontos ideais são maximamente consistentes com 
as preferências de respondentes individuais. Srinivasan e 
Schocker [25] consideram que o ponto ideal para todos os 
pares de estímulos é determinado de forma a violar com o 
menor prejuízo possível a restrição de que o mesmo deve 
ser mais próximo do mais preferido de cada par do que do 
menos preferido. 


Resumo. Em resumo, existem muitos modos de tratar a 
estimação de pontos ideais, e nenhum método em particu- 
lar demonstrou ser o melhor em todos os casos. A escolha 
depende das habilidades do pesquisador e do procedi- 
mento MDS selecionado. 


Posicionamento implícito do ponto ideal 

O posicionamento implícito do ponto ideal a partir de da- 
dos de preferência pode ser conseguido por meio de uma 
análise interna ou externa. 


e A análise interna de dados de preferência refere-se ao de- 
senvolvimento de um mapa compartilhado por pontos (ou 
vetores) de estímulos e sujeitos somente a partir de dados 
de preferência. 

e A análise externa de preferência usa uma configuração 
pré-especificada de objetos e então tenta colocar os pontos 
ideais dentro desse mapa perceptual. 


Cada abordagem tem vantagens e desvantagens, que 
são discutidas nas próximas seções. 


Análise interna. A análise interna deve considerar cer- 
tas suposições para obter o mapa perceptual tanto de 
estímulos quanto de pontos ideais. As posições dos ob- 
jetos são calculadas com base nos dados de preferência 
revelados para cada indivíduo. Os resultados refletem 
dimensões perceptuais que são expandidas e ponderadas 
para prever preferência. Uma característica dos métodos 


de estimação interna é que eles normalmente empregam 
uma representação vetorial do ponto ideal (ver a próxi- 
ma seção para uma discussão sobre representações ve- 
toriais versus pontuais), ao passo que modelos externos 
podem estimar tanto representações vetoriais quanto 
pontuais. 

Como um exemplo dessa abordagem, MDPREF [5] 
ou MDSCAL [17], dois dos programas mais usados, per- 
mitem ao usuário encontrar configurações de estímulos e 
pontos ideais. Ao fazer isso, o pesquisador deve assumir 
o seguinte: 


1. Nenhuma diferença entre respondentes 
2. Configurações separadas para cada respondente 
3. Uma única configuração com pontos ideais individuais. 


Reunindo os dados de preferência, o pesquisador pode 
representar os estímulos e respondentes em um só mapa 
perceptual. 


Análise externa. A análise externa de dados de pre- 
ferência se refere ao ajuste de pontos ideais (baseados 
em dados de preferência) a espaço de estímulos desen- 
volvido a partir de dados de similaridades conseguidos 
com os mesmos sujeitos. Por exemplo, poderíamos es- 
calonar dados de similaridade individualmente, exami- 
nar os mapas individuais em busca de percepções em 
comum, e então escalonar os dados de preferência para 
qualquer grupo identificado dessa forma. Se essa meto- 
dologia for seguida, o pesquisador deverá reunir dados 
de preferência e de similaridade para conseguir uma 
análise externa. 

O PREFMA?P [6] foi desenvolvido exclusivamente 
para executar a análise externa de dados de preferência. 
Como a matriz de similaridades define os objetos no mapa 
perceptual, o pesquisador agora pode definir descritores 
de atributos (assumindo que o espaço perceptual é o mes- 
mo que as dimensões de avaliação) e pontos ideais para 
indivíduos. O PREFMAP fornece estimativas para vários 
tipos de pontos ideais, cada um baseado em diferentes 
suposições quanto à natureza de preferências (p.ex., re- 
presentações vetoriais versus pontuais, ou pesos dimen- 
sionais iguais versus diferentes). 


Escolha entre análise interna e externa. Geralmente 
aceita-se [9, 10, 23] que a análise externa é claramente 
preferível à análise interna. Essa conclusão se baseia nas 
dificuldades computacionais com procedimentos de aná- 
lise interna e na confusão de diferenças em preferência 
com diferenças em percepção. Além disso, as saliências 
de dimensões percebidas podem se alterar quando mu- 
damos de espaço perceptual (os estímulos são similares 
ou dissimilares?) para espaço avaliativo (qual estímulo é 
preferido?). 

Ilustramos o procedimento de estimação externa em 
nosso exemplo de mapeamento perceptual com o MDS 
no final deste capítulo. 
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Representações vetoriais versus pontuais 

A discussão sobre mapeamento perceptual de dados de 
preferência enfatizou um ponto ideal que retrata a relação 
de ordem de preferência de um indivíduo para um con- 
junto de estímulos. A seção anterior discutiu as questões 
relativas ao tipo dos dados e análise usada na estimação e 
posicionamento do ponto ideal. O restante da discussão se 
concentra na maneira em que os outros objetos no mapa 
perceptual se relacionam com o ponto ideal para refletir 
preferência. As duas abordagens (representação pontual 
versus vetorial) são discutidas a seguir. 


Representação pontual. O método mais facilmente en- 
tendido de representação gráfica do ponto ideal é o uso da 
distância em linha reta (euclidiana) de ordem de preferên- 
cia a partir do ponto ideal até todos os pontos que repre- 
sentam os objetos. Estamos considerando que a direção 
da distância a partir do ponto ideal não é algo crítico, mas 
apenas a distância relativa. 


Um exemplo é mostrado na Figura 9-9. Aqui, o ponto 
ideal, como está posicionado, indica que o objeto prefe- 
rido é E, seguido por €, B, D e, finalmente, A. A ordem 
de preferência é diretamente relacionada à distância do 
ponto ideal. 


Representação vetorial. O ponto ideal também pode ser 
exibido como um vetor. Para calcular as preferências nes- 
sa abordagem, retas perpendiculares (também conhecidas 
como projeções) são esboçadas a partir dos objetos até o 
vetor. A preferência aumenta na direção em que o vetor 


Dimensão Il 
Curva de Do ida 
nívelde 2 
preferência EE anel) 


está apontando. As preferências podem ser lidas direta- 
mente da ordem das projeções. 


A Figura 9-10 ilustra a abordagem vetorial para dois su- 
jeitos com o mesmo conjunto de posições de estímulos. 
Para o sujeito 1, o vetor tem a direção de menor prefe- 
rência, no canto esquerdo inferior, para maior preferên- 
cia, no canto direito superior. Quando a projeção para 
cada objeto é feita, a ordem de preferência (de maior 
para menor) é A, B, C, E e D. No entanto, os mesmos ob- 
jetos têm uma ordem de preferência muito diferente para 
o sujeito 2. Para o segundo sujeito, a ordem varia do mais 
preferido, E, para o menos preferido, C. Desse modo, um 
vetor em separado pode representar cada sujeito. 


A abordagem vetorial não fornece um único ponto 
ideal, mas considera-se que o ponto ideal está a uma dis- 
tância infinita exteriormente ao vetor. 

Apesar de tanto as representações pontuais quanto 
vetoriais poderem indicar quais combinações de atributos 
são preferidas, essas observações geralmente não são con- 
firmadas por experimentação complementar. Por exemplo, 
Raymond [22] cita um exemplo no qual a conclusão foi de 
que as pessoas iriam preferir bolachas com base em sua 
umidade e na quantia de chocolate. Quando os técnicos 
em alimentação aplicaram esse resultado no laboratório, 
descobriram que suas bolachas fabricadas com tais espe- 
cificidades experimentais eram simplesmente leite com 
chocolate. Não se pode considerar sempre que as relações 
encontradas são independentes ou lineares, ou que elas 
continuam válidas com o passar do tempo, como já obser- 


Dimensão | 


Ordem de preferência (da maior para a menor): E>C>B>D>A 


(a) Objeto Ponto ideal 


FIGURA 9-9 Representação pontual de um ponto ideal. 
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Sujeito 2 
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Ordem de preferência (da maior para a menor): Sujeito 1:A>B>C>E>D 


Sujeito2:E>A>D>B>C 


FIGURA 9-10 Representações vetoriais de dois pontos ideais: sujeitos 1 e 2. 


vamos. Contudo, o MDS é um começo para a compreensão 
de percepções e de escolha que irá se expandir considera- 
velmente conforme as aplicações ampliarem nosso conhe- 
cimento acerca de metodologia e percepção humana. 


Resumo 

Os dados de preferência são melhor examinados usando- 
se a análise externa como um meio para compreender me- 
lhor as diferenças perceptuais entre objetos baseadas em 
julgamentos de similaridades e as escolhas de preferência 
feitas dentro desse mapa perceptual de objetos. Dessa ma- 
neira, o pesquisador pode distinguir entre ambos os tipos 
de avaliações perceptuais e, mais precisamente, entender 
as percepções de indivíduos no verdadeiro espírito do es- 
calonamento multidimensional. 


ESTÁGIO 5: INTERPRETAÇÃO 
DOS RESULTADOS DO MDS 


Uma vez que o mapa perceptual é obtido, as duas aborda- 
gens — composicional e decomposicional — novamente di- 
vergem na sua interpretação dos resultados. As diferenças 
de interpretação são sustentadas na quantia de informa- 
ção diretamente fornecida na análise (p.ex., os atributos 
incorporados na análise composicional versus sua ausên- 
cia na análise decomposicional) e a generalidade dos re- 
sultados para o real processo de tomada de decisões. 


e Para métodos composicionais, o mapa perceptual pode ser 
diretamente interpretado com os atributos incorporados na 
análise. A solução, porém, deve ser validada contra outras me- 
didas de percepção, pois as posições são totalmente definidas 
pelos atributos especificados pelo pesquisador. Por exemplo, 


os resultados de análise discriminante podem ser aplicados a 
um novo conjunto de objetos ou respondentes, avaliando a 
habilidade de diferenciar com essas novas observações. 

e Para métodos decomposicionais, a questão mais importante 
é a descrição das dimensões perceptuais e sua correspon- 
dência a atributos. Avaliações de semelhança ou preferên- 
cia são feitas sem preocupação com atributos, evitando-se 
assim uma questão de erro de especificação. O risco, po- 
rém, é que as dimensões perceptuais não sejam correta- 
mente traduzidas, no sentido de que as dimensões usadas 
nas avaliações não são refletidas pelos atributos escolhidos 
para sua interpretação. Técnicas descritivas para rotular as 
dimensões, bem como integrar preferências (para objetos 
e atributos) com os julgamentos de similaridades, são dis- 
cutidas adiante. Novamente, de acordo com seus objetivos, 
os métodos decomposicionais fornecem uma visão inicial de 
percepções a partir das quais perspectivas mais formaliza- 
das podem emergir. 


Como outros capítulos deste texto lidam com muitas 
das técnicas composicionais, o restante deste capítulo se 
concentra em métodos decomposicionais, principalmente 
nas técnicas utilizadas em escalonamento multidimensio- 
nal. Uma exceção notável é a discussão de uma aborda- 
gem composicional — análise de correspondência — que, 
até certo ponto, preenche a lacuna entre as duas aborda- 
gens em sua flexibilidade e métodos de interpretação. 


Identificação das dimensões 


Como discutido no Capítulo 3, sobre a interpretação de 
fatores em análise fatorial, a identificação de dimensões 
inerentes geralmente é uma tarefa difícil. As técnicas de 
escalonamento multidimensional não têm procedimen- 
tos internos para rotular as dimensões. O pesquisador, 
após ter desenvolvido os mapas com uma dimensionali- 
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dade selecionada, pode adotar diversos procedimentos, 
sejam subjetivos ou objetivos. 


Procedimentos subjetivos 

A interpretação sempre deve incluir algum elemento 
de julgamento do pesquisador ou do respondente, e em 
muitos casos isso demonstra ser adequado às questões 
em mãos. Um método muito simples, mas efetivo, é a 
rotulação (por inspeção visual) das dimensões do mapa 
perceptual pelo respondente. Os respondentes podem 
ser solicitados a interpretar a dimensionalidade subjeti- 
vamente por inspeção dos mapas, ou um conjunto de es- 
pecialistas pode avaliar e identificar as dimensões. Ape- 
sar de não haver tentativa de conectar quantitativamente 
as dimensões com atributos, essa abordagem pode ser a 
melhor possível se as dimensões são consideradas alta- 
mente intangíveis, ou afetivas ou emocionais em con- 
teúdo, de forma que descritores adequados não possam 
ser delineados. 

De maneira semelhante, o pesquisador pode descre- 
ver as dimensões em termos de características conhecidas 
(objetivas). Dessa maneira, a correspondência é feita en- 
tre dimensões objetivas e perceptuais diretamente, ape- 
sar de essas relações não serem um resultado de opinião 
do respondente, mas do julgamento do pesquisador. 


Procedimentos objetivos 

Como complemento dos procedimentos subjetivos, di- 
versos métodos mais formalizados foram desenvolvidos. 
O método mais amplamente usado, PROFIT (PROperty 
FITting) |3], coleta avaliações de atributos para cada ob- 
jeto e então encontra a melhor correspondência de cada 
atributo com o espaço perceptual obtido. O objetivo é 
identificar os atributos determinantes nos julgamentos 
de similaridade feitos por indivíduos. Medidas de ajuste 
são dadas para cada atributo, bem como sua correspon- 
dência com as dimensões. O pesquisador pode então de- 
terminar quais atributos melhor descrevem as posições 
perceptuais e são ilustrativos das dimensões. A necessi- 
dade de correspondência entre os atributos e as dimen- 
sões definidas diminui com o uso de resultados métricos, 
já que as dimensões podem ser rotacionadas livremente 
sem quaisquer mudanças de interpretação. 


Escolha entre procedimentos 

subjetivos e objetivos 

Tanto para procedimentos subjetivos quanto objetivos, 
o pesquisador deve lembrar que, apesar de uma dimen- 
são poder representar um único atributo, ela geralmen- 
te não o faz. Um procedimento mais comum é coletar 
dados sobre vários atributos, associá-los subjetiva ou 
empiricamente às dimensões quando isso for aplicável, e 
determinar rótulos para cada dimensão usando múltiplos 
atributos, semelhante à análise fatorial. Muitos pesqui- 
sadores sugerem que o uso de dados de atributos para 
ajudar a nomear as dimensões é a melhor alternativa. O 


problema, porém, é que o pesquisador pode não incluir 
todos os atributos importantes no estudo. Logo, ele nun- 
ca pode estar totalmente seguro de que os rótulos repre- 
sentam todos os atributos relevantes. 

Os procedimentos subjetivos e objetivos ilustram a 
dificuldade de rotular os eixos. Essa tarefa é essencial, já 
que os rótulos dimensionais são exigidos para posterior 
interpretação e uso dos resultados. O pesquisador deve 
selecionar o tipo de procedimento que melhor se ajuste 
aos objetivos da pesquisa e à informação disponível. As- 
sim, ele deve planejar a derivação dos rótulos dimensio- 
nais, bem como a estimação do mapa perceptual. 


ESTÁGIO 6: VALIDAÇÃO DOS 
RESULTADOS DO MDS 


A validação em MDS é tão importante quanto em outra 
técnica multivariada. Devido à natureza altamente infe- 
rencial do MDS, esse esforço deve ser direcionado à ga- 
rantia de generalidade dos resultados entre objetos e para 
a população. Como se vê na próxima discussão, o MDS 
apresenta questões particularmente problemáticas na 
validação, tanto de um ponto de vista substancial quanto 
metodológico. 


Questões da validação 


Qualquer solução MDS deve lidar com duas questões es- 
pecíficas que complicam os esforços para validação dos 
resultados: 


e O único resultado de MDS que pode ser usado para fins 
comparativos envolve as posições relativas dos objetos. 
Logo, apesar de as posições poderem ser comparadas, as di- 
mensões inerentes não têm qualquer base para comparação. 
Se as posições variam, o pesquisador não pode determinar 
se os objetos são vistos diferentemente, se as dimensões 
perceptuais variam, ou se ambos acontecem. 

e Métodos sistemáticos de comparação não foram desenvolvi- 
dos e integrados nos programas estatísticos. O pesquisador 
deve improvisar com procedimentos que abordem questões 
gerais mas que não sejam específicos para resultados MDS. 


Como resultado, pesquisadores devem insistir em seus 
esforços de validação, para manter comparabilidade en- 
tre soluções enquanto se provê uma base empírica para 
comparação. 


Abordagens para validação 


Qualquer abordagem de validação tenta avaliar genera- 
lidade (p.ex., similaridade em diferentes amostras), en- 
quanto mantém comparabilidade. Os problemas discu- 
tidos na seção anterior, porém, tornam essas exigências 
difíceis para qualquer solução MDS. Diversas técnicas de 
validação que atendem cada exigência em algum grau são 
discutidas a seguir. 
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Análise de amostras particionadas 

A abordagem de validação mais direta é uma comparação 
entre amostras particionadas ou multi-amostras, na qual a 
amostra original é dividida ou uma nova amostra é cole- 
tada. Em qualquer caso, o pesquisador deve então encon- 
trar um meio para comparar os resultados. Muitas vezes, 
a comparação entre resultados é feita visualmente ou com 
uma simples correlação de coordenadas. Alguns progra- 
mas de comparação estão disponíveis, como FMATCH 
[24], mas o pesquisador ainda deve determinar quantas 
das disparidades decorrem das diferenças em percepções 
de objetos, em dimensões ou ambas. 


Comparação de soluções decomposicionais 

versus composicionais 

Um outro método é obter uma convergência de resulta- 
dos MDS pela aplicação de técnicas composicionais e de- 
composicionais na mesma amostra. Os métodos decom- 
posicionais poderiam ser aplicados em primeiro lugar, 
juntamente com a interpretação das dimensões para iden- 
tificar atributos-chave. Então, um ou mais métodos com- 
posicionais, particularmente a análise de correspondência, 
poderiam ser aplicados para confirmar os resultados. O 
pesquisador deve perceber que isso não é uma verdadei- 
ra validação dos resultados em termos de generalidade, 
mas confirma a interpretação da dimensão. Deste ponto 
de vista, esforços de validação com outras amostras e ou- 
tros objetos poderiam ser empreendidos para demonstrar 
a generalidade para outras amostras. 


Resumo 

A falta de métodos internos para comparação direta entre 
soluções, juntamente com a difícil tarefa de se comparar 
soluções perceptuais, resulta em vários métodos ad hoc 
para validação, sendo que nenhum deles é completamen- 
te satisfatório. Pesquisadores são encorajados a aplicarem 
ambas as técnicas de validação sempre que possível, para 
obterem o máximo de suporte para a generalidade de 
qualquer solução MDS. 


VISÃO GERAL DO ESCALONAMENTO 
MULTIDIMENSIONA L 


Escalonamento multidimensional representa um método 
distinto para a análise multivariada quando comparado 
com outros métodos neste texto. Enquanto outras téc- 
nicas estão focadas na especificação precisa de atributos 
abrangendo variáveis independentes e/ou dependentes, 
o escalonamento multidimensional segue um tratamento 
totalmente diferente. Ele reúne apenas medidas globais 
ou holísticas de similaridade ou preferência e, em seguida, 
infere empiricamente as dimensões (caráter e número) 
que refletem a melhor explicação das respostas de um in- 
divíduo, seja em separado ou coletivamente. Nesta técni- 
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Obtenção e validação de uma solução MDS 


Medidas de desajuste (valores menores são melhores) 
representam um ajuste de solução MDS 
Pesquisadores podem identificar uma solução MDS 
degenerada que é geralmente problemática procurando 
por: 
e Um padrão circular de objetos que sugere que todos 
eles são igualmente semelhantes, ou 
e Uma solução multiagregada na qual objetos são 
reunidos em dois extremos de um único contínuo 
O número apropriado de dimensões para um mapa 
perceptual é baseado em: 
Um julgamento subjetivo se a solução com uma dada 


dimensionalidade é razoável 


Uso de um gráfico scree para identificar onde 
acontece uma substancial melhora de ajuste 
Uso de Rº como um índice de ajuste; medidas de 0,6 
ou mais são consideradas aceitáveis 
Análise externa, como a executada por PREFMAP, é 
considerada preferível na geração de pontos ideais, em 
comparação com análise interna 
O método de validação mais direto é uma abordagem 
via amostras particionadas 
e Múltiplas soluções são geradas particionando a 
amostra original ou coletando novos dados 
Validade é indicada quando as múltiplas soluções 
conferem 


ca, a variável estatística usada em muitos outros métodos 
se transforma nas dimensões perceptuais inferidas a partir 
da análise. Como tal, o pesquisador não tem que se pre- 
ocupar com questões como erro de especificação, multi- 
colinearidade ou características estatísticas das variáveis. 
O desafio para o pesquisador, porém, é a interpretação 
da variável estatística; sem uma interpretação válida, os 
objetivos principais de MDS ficam comprometidos. 

A aplicação de MDS é adequada quando o objetivo é 
mais orientado para a compreensão das preferências ou 
percepções gerais, em vez de perspectivas detalhadas que 
envolvam atributos individuais. No entanto, uma técnica 
combina a especificidade da análise de atributos dentro de 
soluções do tipo MDS. Tal método, análise de correspon- 
dência, é discutido na seção a seguir, onde as semelhanças 
e diferenças em relação a técnicas tradicionais de MDS 
são destacadas. 


ANÁLISE DE CORRESPONDÊNCIA 


Até este ponto, discutimos as abordagens decomposicio- 
nais tradicionais para MDS; mas e quanto às técnicas com- 
posicionais? No passado, as abordagens composicionais 
basearam-se em técnicas multivariadas tradicionais, como 
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as análises discriminante e fatorial. Mas desenvolvimen- 
tos recentes combinam aspectos de ambos os métodos e 
o MDS para formar novas e poderosas ferramentas para 
mapeamento perceptual. 


Características diferenciadas 


Análise de correspondência (CA) é uma técnica de inter- 
dependência que tem se tornado cada vez mais popular 
para redução dimensional e mapeamento perceptual [1, 2, 
11, 13, 19]. Também é conhecida como escalonamento ou 
escore ótimo, média recíproca ou análise de homogeneida- 
de. Quando comparada com as técnicas MDS descritas na 
parte anterior deste capítulo, a análise de correspondência 
apresenta três características que a distinguem: 


1. É uma técnica composicional, e não decomposicional, por- 
que o mapa perceptual é baseado na associação entre obje- 
tos e um conjunto de características descritivas ou atributos 
especificados pelo pesquisador. 

2. Sua aplicação mais direta é na retratação da correspondência 
de categorias de variáveis, particularmente aquelas medidas 
em escalas nominais. Tal correspondência é, desse modo, a 
base para o desenvolvimento de mapas perceptuais. 

3. Os únicos benefícios de CA residem em sua habilidade para 
representar linhas e colunas, por exemplo, marcas e atribu- 
tos, em um espaço conjunto. 


Diferenças de outras técnicas multivariadas 


Entre as técnicas composicionais, a análise fatorial é a 
mais semelhante pela definição de dimensões compostas 
(fatores) das variáveis (p.ex., atributos) e pela representa- 
ção gráfica de objetos (p. ex., produtos) em seus escores 
sobre cada dimensão. Na análise discriminante, produtos 
podem ser distinguidos por seus perfis em um conjunto de 
variáveis e graficamente representados em um espaço di- 
mensional. A análise de correspondência se estende além 
dessas duas técnicas composicionais: 


e CA pode ser usada com dados nominais (p.ex., contagens 
de frequência de preferência para objetos em um conjunto 
de atributos) em vez de avaliações métricas de cada obje- 
to sobre cada objeto*. Tal capacidade permite que CA seja 
usada em muitas situações nas quais as técnicas multivaria- 
das mais tradicionais são inadequadas. 


*N. de R.T.: A frase correta seria “de cada objeto sobre cada atri- 
buto”. 


e CA cria mapas perceptuais em um único passo, onde va- 
riáveis e objetos são simultaneamente representados no 
mapa perceptual com base diretamente na associação de 
variáveis e objetos. As relações entre objetos e variáveis 
são a meta explícita da CA. 


Primeiro examinamos um exemplo simples da CA para 
ter uma noção de seus princípios básicos. Em seguida, dis- 
cutimos cada um dos seis estágios do processo de tomada 
de decisões introduzido no Capítulo 1. A ênfase está nos 
elementos únicos da CA quando comparada com os méto- 
dos decomposicionais de MDS discutidos anteriormente. 


Um exemplo simples de CA 


Examinemos uma situação simples como uma introdução 
à CA. Em sua forma mais básica, a CA examina as rela- 
ções entre categorias de dados nominais em uma tabela 
de contingência, a tabulação cruzada de duas variáveis 
categóricas (não-métricas). Talvez a forma mais comum 
de tabela de contingência seja a tabulação cruzada de ob- 
jetos e atributos (p. ex., os atributos mais distintos para 
cada produto ou vendas por categoria demográfica). A 
CA pode ser aplicada a qualquer tabela de contingência 
e retratar um mapa perceptual relacionando as catego- 
rias de cada variável não-métrica em um único mapa. 


Usemos um exemplo simples de vendas de produtos 
ao longo de uma única variável demográfica (idade). 
Os dados em tabulação cruzada (ver Tabela 9-2) retra- 
tam as vendas para os produtos A, B e C distribuídas 
em três categorias de idade (jovens adultos, que estão 
entre 18 e 35 anos; meia-idade, entre 36 e 55 anos; e 
idosos, a partir de 56). 


Utilização de dados de tabulação cruzada 

O que podemos aprender a partir dos dados de tabulação 
cruzada? Primeiro, podemos olhar os totais das colunas 
e linhas para identificar a ordenação das categorias (de 
maiores para menores). Mas mais importante, podemos 
ver os tamanhos relativos de cada célula da tabela de 
contingência refletindo a quantia de cada variável para 
cada objeto. A comparação de células pode identificar 
padrões que refletem associações entre certos objetos e 
atributos. 


TABELA 9-2 Dados de tabulação cruzada detalhando vendas de produtos por categoria etária 


Vendas 
Categoria etária A B Cc Total 
Jovens adultos (18-35 anos) 20 20 20 60 
Meia-idade (36-55 anos) 40 10 40 90 
Indivíduos idosos (56 anos ou mais) 20 10 40 70 
Total 80 40 100 220 
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Vendo a Tabela 9-2, percebemos que as vendas variam 
bastante com os produtos (o produto C tem as mais al- 
tas vendas totais, e o produto B, as mais baixas) e com 
os grupos etários (meia-idade compra mais unidades, e 
jovens adultos compram menos). Mas queremos identifi- 
car algum padrão para as vendas, de modo que possamos 
estabelecer que os jovens compram mais do produto X 
ou os idosos compram mais do produto Z. 


Para identificarmos padrões distintos, precisamos de 
mais dois elementos que ajudem a refletir a distinção de 
cada célula (frequência) relativa a outras células. 


Padronização de contagens de fregiiência. O primeiro 
é uma medida padronizada das contagens de células que 
considera simultaneamente as diferenças em totais de li- 
nhas e colunas. Podemos diretamente comparar as células 
quando todos os totais de linhas e colunas são iguais, o 
que raramente é o caso. Em vez disso, os totais de linhas e 
colunas são geralmente desiguais. Neste caso, precisamos 
de uma medida que compare o valor de cada célula com 
um valor esperado que reflita os totais específicos de linha 
e coluna daquela célula. 


Em nosso exemplo de vendas, esperamos que cada grupo 
etário do produto C tenha os maiores totais se todas as 
demais coisas forem iguais, pois o produto C tem as maio- 
res vendas gerais. Analogamente, como os dados incluem 
mais adultos de meia-idade do que de qualquer outra 
categoria, esperamos assim que a célula para vendas do 
produto C entre adultos de meia idade seja a maior. Ain- 
da que o valor de 40 seja o maior, diversas outras células 
também apresentam o mesmo valor. Tais valores signifi- 
cam que aquela célula é tão alta quanto o esperado, e se 
não, qual entre as demais células é realmente a maior? 
Assim, precisamos de uma medida que mostre o quão aci- 
ma ou abaixo uma célula específica está quando compara- 
da com algumas medidas esperadas de vendas. 


Representação de cada célula. Mesmo com uma medida 
padronizada, ainda precisamos de um método para re- 
tratar cada célula em um mapa perceptual. Aqui, células 
com valores padronizados maiores que o esperado devem 
fazer com que combinações de objetos/variáveis fiquem 
localizadas mais próximas, ao passo que valores padroni- 
zados muito menores que o esperado podem fazer com 
que tais combinações fiquem mais separadas. A tarefa é 
desenvolver um mapa perceptual que melhor retrate to- 
das as associações representadas pelas células da tabela 
de contingência. 


Em nosso exemplo de produto, examinemos as três cé- 
lulas com valores de 40. Como descrevemos, a célula de 


Meia-idade/Produto C deve ter um valor alto por ser 
uma combinação das maiores categorias de linha e co- 
luna. Mas e quanto às vendas de 40 unidades da catego- 
ria do Produto A na categoria Meia-idade? O Produto 
A tem vendas gerais menores que o Produto C, e assim 
esse resultado provavelmente mostra uma associação de 
algum modo maior entre essas duas categorias. Então 
temos as vendas de 40 unidades entre indivíduos idosos 
e o Produto €. Aqui, podemos dizer que esta célula tem 
associação maior do que nossa primeira célula (Produto 
C/Meia-idade), pois ambas são para o Produto C. Como 
esses resultados se comparam com vendas do Produto 
A no grupo de Meia-idade? Não importa quais sejam 
os valores padronizados, queremos ter as categorias de 
Indivíduos Idosos/Produto C e Meia-idade/Produto A 
representadas mais proximamente entre si em um mapa 
perceptual do que Meia-idade/Produto C. 

Em uma representação gráfica, grupos etários esta- 
riam localizados mais próximos a produtos com os quais 
são altamente associados e mais afastados daqueles com 
menores associações. Analogamente, queremos ser ca- 
pazes de ver qualquer produto e perceber suas associa- 
ções com vários grupos etários. 


Para este fim, discutimos nas próximas seções como 
CA calcula uma medida padronizada de associação com 
base nas contagens de células da contingência, e então o 
processo pelo qual essas associações são convertidas em 
um mapa perceptual. 


Cálculo de uma medida de 

associação ou similaridade 

A análise de correspondência usa um dos conceitos es- 
tatísticos mais básicos, o qui-quadrado, para padroni- 
zar os valores de frequência da tabela de contingência 
e formar a base para associação ou similaridade. Qui- 
quadrado é uma medida padronizada de frequências 
reais de células comparadas com freqiiências esperadas 
de células. Em nossos dados tabulados, cada célula con- 
tém os valores para uma combinação específica de linha/ 
coluna. O procedimento qui-quadrado prossegue então 
em quatro passos para calcular um valor qui-quadrado 
para cada célula e então transformá-lo em uma medida 
de associação: 


Passo 1: Cálculo das vendas esperadas. O primeiro pas- 
so é calcular o valor esperado para uma célula como se 
não existisse qualquer associação. As vendas esperadas 
são definidas como a probabilidade conjunta da combi- 
nação da coluna com a linha. Isso é calculado como a pro- 
babilidade marginal para a coluna (total da coluna / total 
geral) vezes a probabilidade marginal para a linha (total 
da linha /total geral). Esse valor é então multiplicado pelo 
total geral. Para qualquer célula, o valor esperado pode 
ser simplificado pela seguinte equação: 
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Total da coluna da célula 
Contagem esperada x Total da linha da célula 
da célula = 


Total geral 


Este cálculo representa a freqiiência esperada da célu- 
la dadas as proporções para os totais de linha e coluna. 

As fregiiências esperadas fornecem uma base para 
comparação com as frequências reais e viabilizam o cál- 
culo de uma medida padronizada de associação usada na 
construção do mapa perceptual. 


Em nosso exemplo simples, as vendas esperadas para os 
Jovens adultos que compram o Produto A são de 21,82 
unidades, como mostrado no seguinte cálculo: 


60 x 80 
220 


Vendas esperadas =21,82 


Jovens adultos, Produto A = 


Esse cálculo é feito para cada célula, com os resulta- 
dos exibidos na Tabela 9-3. 


Passo 2: Diferença entre fregiiências de células esperadas 
ereais. O próximo passo é calcular a diferença entre as 
frequências esperadas e as reais da seguinte maneira: 


Diferença = Freqiiência esperada — Fregiiência real. 


A magnitude de diferença denota a força de asso- 
ciação e o sinal (positivo para associação menor que o 
esperado, e negativo para uma associação maior que o 


TABELA 9-3 Cálculo de valores qui-quadrado de similaridade para dados de tabulação cruzada 


Vendas de produto 


Categoria etária A B Cc Total 
Jovens 
Vendas 20 20 20 60 
Percentual da coluna 25% 50% 20% 27% 
Percentual da linha 33% 33% 33% 100% 
Vendas esperadas” 21,82 10,91 27,27 60 
Diferença? 1,82 —9,09 7,27 = 
Valor qui-quadrado” 0,15 7,58 1,94 9,67 
Meia-idade 
Vendas 40 10 40 90 
Percentual da coluna 50% 25% 40% 41% 
Percentual da linha 44% 1% 44% 100% 
Vendas esperadas 32,73 16,36 40,91 90 
Diferença —7,27 6,36 0,91 di 
Valor qui-quadrado 1,62 2,47 0,02 4,11 
Idosos 
Vendas 20 10 40 70 
Percentual da coluna 25% 25% 40% 32% 
Percentual da linha 29% 14% 57% 100% 
Vendas esperadas 25,45 12,73 31,82 70 
Diferença 5,45 2,73 -8,18 = 
Valor qui-quadrado 1,17 0,58 2,10 3,85 
Total 
Vendas 80 40 100 220 
Percentual da coluna 100% 100% 100% 100% 
Percentual da linha 36% 18% 46% 100% 
Vendas esperadas 80 40 100 220 
Diferença — — — — 
Valor qui-quadrado 2,94 10,63 4,06 17,63 


“Vendas esperadas = (Total da linha x Total da coluna)/Total geral 
Exemplo: Célula vens aduitos, Produto a = (60 X 80) / 220 = 21,82 


"Diferença = Vendas esperadas — Vendas reais 


Exemplo: Célula oyens adultos, Produto À = 21,82 — 20,00 = 1,82 


Diferença” 


“Valor qui-quadrado = ————E 
Vendas esperadas 


Exemplo: Célula ens adutos, Produto A = 1,827 / 21,82 = 0,15 
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esperado) representado neste valor. É importante obser- 
var que o sinal, na verdade, é invertido quanto ao tipo de 
associação — um sinal negativo significa uma associação 
positiva (fregiiências reais excederam as esperadas) e 
vice-versa. 


Novamente, em nosso exemplo da célula para Jovens 
que compram o Produto A, a diferença é 1,82 (21,82 — 
20,00). A diferença positiva indica que as vendas reais 
são menores do que o esperado para esta combinação de 
grupo etário com produto, o que significa menos vendas 
do que o esperado (uma associação negativa). Células 
nas quais acontecem diferenças negativas indicam asso- 
ciações positivas (a célula realmente comprou mais do 
que o esperado). As diferenças para cada célula também 
são exibidas na Tabela 9-3. 


Passo 3: Cálculo do valor qui-quadrado. O próximo 
passo é padronizar as diferenças ao longo das células de 
forma que comparações possam ser facilmente realizadas. 
A padronização é exigida porque seria muito mais fácil 
as diferenças ocorrerem se a frequência da célula fosse 
muito alta comparada com uma célula com apenas poucas 
vendas. Portanto, padronizamos as diferenças para for- 
mar um valor qui-quadrado dividindo cada diferença ao 
quadrado pelo valor de vendas esperado. Assim, o valor 
qui-quadrado para uma célula é calculado como: 


Valor qui-quadrado | Diferença? 


(x?) de uma célula Frequência esperada da célula 


Para a célula de nosso exemplo, o valor qui-quadrado 
seria: 


2 
= (1,82) = 0 15 


E) 


Valor qui-quadrado ( x”) 


Jovens adultos, Produto A 21 82 
, 


Os valores calculados para as outras células também 
são mostrados na Tabela 9-3. 


Passo 4: Criação de uma medida de associação. O passo 
final é converter o valor do qui-quadrado para uma medida 
de similaridade. O qui-quadrado denota o grau ou quantia 
de similaridade ou associação, mas o processo de calcular 
o qui-quadrado (elevando a diferença ao quadrado) remo- 
ve a direção da similaridade. Para restaurar tal direção, 
usamos o sinal da diferença original. Para tornar a medida 
de similaridade mais intuitiva (ou seja, valores positivos 
são associação maior e valores negativos são associação 
menor) também invertemos o sinal da diferença original. 
O resultado é uma medida que atua simplesmente como as 
medidas de similaridade usadas em exemplos anteriores. 
Valores negativos indicam menor associação (similarida- 
de) e valores positivos apontam para maior associação. 


Em nosso exemplo, o valor qui-quadrado para Jovens 
adultos que compram o Produto A de 0,15 seria declarado 
como um valor de similaridade de —0,15, pois a diferença 
(1,82) foi positiva. Este sinal negativo é necessário porque 
o cálculo de qui-quadrado eleva as diferenças ao quadrado, 
o que elimina sinais negativos. Os valores qui-quadrado 
para cada célula são também exibidos na Tabela 9-3. 

As células com grandes valores positivos de simila- 
ridade (indicativos de uma associação positiva) são Jo- 
vens adultos/Produto B (17,58)*, Meia-idade/Produto A 
(11,62)* e Idosos/Produto C (12,10)***. Cada um desses 
pares de categorias deve estar próximo um do outro em um 
mapa perceptual. Células com grandes valores negativos 
de similaridade (o que significa que as vendas esperadas 
superaram as vendas reais, ou seja, uma associação nega- 
tiva) foram Jovens adultos/Produto C (-1,94), Meia-idade/ 
Produto B (-2,47) e Idosos/Produto A (-1,17). Se possível, 
essas categorias devem estar bem distantes no mapa. 


Criação do mapa perceptual 

Os valores de similaridades (qui-quadrados com sinal) 
fornecem uma medida padronizada de associação, mui- 
to parecida com os julgamentos de similaridades usados 
anteriormente nos métodos MDS. Com essas medidas de 
associação/similaridade, a CA cria um mapa perceptual 
usando a medida padronizada para estimar dimensões or- 
togonais sobre as quais as categorias podem ser colocadas 
para explicar melhor a intensidade de associação repre- 
sentada pelas distâncias qui-quadrado. 

Como fizemos no exemplo do MDS, consideramos pri- 
meiro uma solução unidimensional, e então expandimos 
para duas dimensões e continuamos até que alcancemos o 
número máximo de dimensões. O máximo é um a menos 
do que o menor dentre os números de linhas ou colunas. 


Em nosso exemplo, podemos ter apenas duas dimensões 
(menor dos números de linhas ou colunas menos um, ou 
3-1=2). O mapa perceptual bidimensional é mostrado na 
Figura 9-11. Correspondendo ao nosso exame das medidas 
de similaridade, o grupo etário de Jovens Adultos está mais 
próximo do Produto B, a Meia-idade está mais próxima do 
Produto A, e os Idosos estão mais próximos do Produto 
C. De modo semelhante, as associações negativas também 
estão representadas nas posições de produtos e grupos etá- 
rios. O pesquisador pode examinar o mapa perceptual para 
entender as preferências por produtos entre grupos etários 
com base em seus padrões de vendas. Entretanto, assim 
como em MDS, não sabemos por que os padrões de vendas 
existem, porém apenas como identificá-los. 


* N. de R.T.: O número correto é 7,58. 
** N. de R. T.: O número correto é 1,62. 
*** N. de R. T.: O número correto é 2,10. 
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FIGURA 9-11 Mapa perceptual da análise de correspondência. 


Resumo 

Análise de correspondência é um método híbrido de es- 
calonamento multidimensional no sentido de que utiliza 
dados não-métricos cruzados para criar mapas percep- 
tuais que podem posicionar as categorias de todas as 
variáveis em um único mapa. Fazendo isso, ela estende 
a análise MDS para todo um domínio de questões de 
pesquisa previamente não tratáveis pelos métodos MDS 
tradicionais. 


Uma estrutura de decisão para 
análise de correspondência 


A análise de correspondência e as questões associadas 
com uma análise bem sucedida podem ser vistas po meio 
do processo de construção de modelo introduzido no Ca- 
pítulo 1. Nas seções a seguir, examinamos as questões úni- 
cas associadas com análise de correspondência em com- 
paração com métodos MDS ao longo de seis estágios do 
processo decisório. 


Estágio 1: Objetivos da CA 


Os pesquisadores são constantemente confrontados com a 
necessidade de quantificar os dados qualitativos encontra- 
dos em variáveis nominais. A CA difere de outras técnicas 
MDS em sua habilidade de acomodar tanto dados não- 
métricos quanto relações não-lineares. Ela faz redução 
dimensional semelhante a escalonamento multidimen- 


sional e um tipo de mapeamento perceptual no qual as 
categorias são representadas no espaço multidimensional. 
A proximidade indica o nível de associação entre as cate- 
gorias linha ou coluna. A CA pode satisfazer qualquer um 
dos dois objetivos básicos: 


1. Associação entre somente categorias de linha ou de coluna. 
A CA pode ser usada para examinar a associação entre as 
categorias de apenas uma linha ou coluna. Um uso comum 
é o exame das categorias de uma escala, como a escala Li- 
kert (cinco categorias que variam de “concordo plenamen- 
te” a “discordo plenamente”) ou outras escalas qualitativas 
(p.ex., excelente, bom, regular, ruim). As categorias podem 
ser comparadas para ver se duas podem ser combinadas 
(isto é, elas estão muito próximas no mapa) ou se fornecem 
discriminação (ou seja, estão localizadas separadamente no 
espaço perceptual). 

2. Associação entre categorias de linha e coluna. Nesta aplica- 
ção, o interesse repousa na representação da associação en- 
tre categorias das linhas e colunas, como nosso exemplo de 
vendas de produto por faixa etária. Esse uso é mais seme- 
lhante ao exemplo anterior de MDS e tem impelido a CA a 
um uso mais amplo em diversas áreas de pesquisa. 


O pesquisador deve determinar os objetivos especí- 
ficos da análise, porque certas decisões são baseadas em 
qual tipo de objetivo é escolhido. A CA fornece uma 
representação multivariada de interdependência para 
dados não-métricos que não é possível com outros méto- 
dos. Com uma técnica composicional, o pesquisador deve 
garantir que todas as variáveis relevantes adequadas à 
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questão de pesquisa tenham sido incluídas. Isso está em 
contraste com os procedimentos decomposicionais MDS 
descritos anteriormente, os quais exigem apenas a medida 
geral de similaridade. 


Estágio 2: Projeto de pesquisa de CA 


A análise de correspondência exige apenas uma matriz 
retangular* de dados (tabulação cruzada) de entradas 
não-negativas. O tipo mais comum de matriz de entrada 
é uma tabela de contingência com categorias específicas 
definindo as linhas e colunas. Ao se criar a tabela, sur- 
gem diversas questões, relativas à natureza das variáveis 
e categorias compreendendo linhas e colunas: 


1. As linhas e colunas não têm significados pré-definidos (ou 
seja, os atributos não têm que ser sempre linhas e assim por 
diante), mas, em vez disso, representam as respostas a uma 
ou mais variáveis categóricas. As categorias nas linhas e co- 
lunas, porém, devem ter um significado específico para fins 
de interpretação. 

2. As categorias para uma linha ou coluna não precisam ser 
uma só variável, mas podem representar qualquer conjun- 
to de relações. Um primeiro exemplo é o método “escolha 
qualquer um” [14, 15], no qual é dado aos respondentes um 
conjunto de objetos e características. Os respondentes en- 
tão indicam quais objetos, se houver algum, são descritos 
pelas características. O respondente pode escolher qualquer 
número de objetos para cada característica, e a tabela de 
tabulação cruzada é o número total de vezes em que cada 
objeto foi descrito por cada característica. 

3. A tabulação cruzada pode ocorrer para mais de duas variá- 
veis em uma forma matricial multivariada. Em tais casos, a 
análise de correspondência múltipla é empregada. Em um 
procedimento muito semelhante à análise bivariada, as va- 
riáveis adicionais são ajustadas de forma que todas as cate- 
gorias são colocadas no mesmo espaço multidimensional. 


A natureza generalizada dos tipos de relações que po- 
dem ser retratadas na tabela de contingência torna a CA 
uma técnica amplamente aplicável. Seu uso crescente nos 
últimos anos é um resultado direto do contínuo desenvol- 
vimento de abordagens que usam este formato para anali- 
sar novos tipos de relações. 


Estágio 3: Suposições em CA 

A análise de correspondência compartilha com as técni- 
cas mais tradicionais de MDS uma relativa liberdade de 
pressupostos. O uso de dados estritamente não-métricos 
em sua forma mais simples (dados tabulados cruzados) 
representa as relações lineares e não-lineares igualmente 
bem. A falta de suposições, porém, não deve fazer com 
que o pesquisador negligencie os esforços para garantir 
a comparabilidade de objetos e, como essa é uma técnica 
composicional, a completude dos atributos usados. 


*N. de R. T.: Seria mais adequada a expressão “de dupla entrada”, 
tendo em vista que tal matriz pode também ser quadrada, quando 
linhas e colunas apresentam o mesmo número de categorias. 


Estágio 4: Determinação dos resultados 
da CA e avaliação do ajuste geral 


Com uma tabela de dados cruzados, as freqiiências para 
qualquer combinação de categorias de linhas-colunas são 
relacionadas com outras combinações com base nas fre- 
quências marginais. Como descrito em nosso exemplo an- 
terior, a análise de correspondência usa essa relação bási- 
ca em três passos para criar um mapa perceptual: 


1. Calcula uma expectativa condicional (a frequência espe- 
rada de célula) que representa a similaridade ou associação 
entre categorias de linha e coluna. 

2. Uma vez obtidas, computam-se as diferenças entre as fre- 
quências reais e esperadas e converte-se as mesmas a uma 
medida padronizada (qui-quadrado). Usando-se esses resul- 
tados como uma métrica de distâncias, torna-se os mesmos 
comparáveis com as matrizes de entrada usadas nas aborda- 
gens MDS já discutidas. 

3. Através de um processo muito parecido com o escalona- 
mento multidimensional, cria-se uma série de soluções di- 
mensionais (unidimensional, bidimensional etc.) sempre 
que possível. As dimensões relacionam simultaneamente as 
linhas e colunas em um único gráfico conjunto. O resultado 
é uma representação de categorias de linhas e/ou colunas 
(p.ex., marcas e atributos) no mesmo gráfico. 


Determinação do impacto de células individuais 
Deve ser observado que os dois termos específicos, de- 
senvolvidos em análise de correspondência, descrevem as 
propriedades dos valores de frequência e sua contribuição 
relativa à análise. 


e O primeiro termo é massa, que é primeiramente definido 
para qualquer entrada individual na tabulação cruzada 
como o percentual do total representado por aquela entra- 
da. É calculado como o valor de qualquer entrada dividido 
por N (o total para a tabela, que é a soma das linhas ou colu- 
nas). Assim, a soma de todas as entradas da tabela (células) 
é igual a 1,0. Também podemos calcular a massa de qual- 
quer categoria de linha ou coluna, somando ao longo de to- 
das as entradas. Tal resultado representa a contribuição de 
qualquer categoria de linha ou coluna para a massa total. 

e A segunda medida é inércia, que é definida como o qui- 
quadrado total dividido por N (o total das contagens de fre- 
qiuência). Deste modo temos uma medida relativa de qui- 
quadrado que pode ser relacionada com qualquer contagem 
de frequência. 


Com essas semelhanças com MDS surge um conjun- 
to parecido de problemas, centrados em duas questões 
fundamentais na avaliação de ajuste geral: avaliação da 
importância relativa das dimensões, e então a identifica- 
ção do número apropriado de dimensões. Cada um desses 
aspectos é discutido na próxima seção. 


Avaliação do número de dimensões 

Autovalores, também conhecidos como valores singula- 
res, são obtidos para cada dimensão e indicam a contribui- 
ção relativa de cada dimensão na explicação da variância 
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nas categorias. Semelhante à análise fatorial, podemos 
determinar a quantia de variância explicada tanto para 
dimensões individuais quanto para a solução como um 
todo. Alguns programas, como os de SPSS, introduzem 
uma medida chamada de inércia, que também mede va- 
riação explicada e está diretamente relacionada com o 
autovalor. 


Determinação do número de dimensões 

O número máximo de dimensões que pode ser estimado 
é um a menos do que o menor número entre a quantia de 
linhas ou de colunas. Por exemplo, com seis colunas e oito 
linhas, o número máximo de dimensões seria cinco, o que 
corresponde a seis (o número de colunas) menos um. 

O pesquisador seleciona o número de dimensões 
com base no nível geral de variância explicada deseja- 
da e na explicação extra ganha pelo acréscimo de uma 
outra dimensão. Ao avaliar dimensionalidade, o pesqui- 
sador está diante de negociações muito parecidas com 
outras soluções MDS ou mesmo de análise fatorial (Ca- 
pítulo 3): 

e Cada dimensão adicionada à solução aumenta a variância 
explicada da solução, mas em uma quantia decrescente (ou 
seja, a primeira dimensão explica a maior parte da variân- 
cia, a segunda explica a segunda maior parte, e assim por 
diante). 

e Adicionar dimensões aumenta a complexidade do processo 
de interpretação; mapas perceptuais com mais de três di- 
mensões se tornam cada vez mais complexos para análise. 


O pesquisador deve equilibrar o desejo por variância 
explicada maior versus a solução mais complexa que pos- 
sa afetar a interpretação. Uma dica prática é que dimen- 
sões com inércia (autovalores) maiores que 0,2 devem ser 
incluídas na análise. 


Estimação do modelo 

Vários programas de computador estão à disposição para 
realizar a análise de correspondência. Entre os programas 
mais populares, estão ANACOR e HOMALS, disponí- 
veis no SPSS; CA de BMDP; CORRAN e CORRESP de 
PC-MDS [24]; e MAPWISE [21]. Um grande número de 
aplicações especializadas tem surgido em disciplinas es- 
pecíficas como ecologia, geologia e muitas das ciências 
sociais. 


Estágio 5: Interpretação dos resultados 


Logo que a dimensionalidade tiver sido estabelecida, o 
pesquisador se defronta com duas tarefas: interpretar as 
dimensões para compreender a base para a associação en- 
tre categorias e avaliar o grau de associação entre catego- 
rias, dentro de uma linha/coluna ou entre linhas e colunas. 
Fazendo isso, o pesquisador ganha uma compreensão a 
respeito das dimensões inerentes sobre as quais o mapa 
perceptual se baseia, juntamente com a associação deriva- 
da de qualquer conjunto específico de categorias. 


Definição do caráter das dimensões 

Se o pesquisador está interessado em definir o caráter de 
uma ou mais dimensões em termos das categorias de li- 
nha ou coluna, medidas descritivas em cada programa de 
computador indicam a associação de cada categoria a uma 
dimensão específica. Por exemplo, em SPSS a medida de 
inércia (usada para avaliar o grau de variância explicada) 
é decomposta ao longo das dimensões. Semelhantes, em 
caráter, a cargas fatoriais, esses valores representam a ex- 
tensão da associação para cada categoria individualmente 
com cada dimensão. O pesquisador pode então nomear 
cada dimensão em termos das categorias mais associadas 
com ela. 

Além de representar a associação de cada categoria 
com cada dimensão, os valores de inércia podem ser to- 
talizados ao longo de dimensões em uma medida cole- 
tiva. Fazendo isso, ganhamos uma medida empírica do 
grau em que cada categoria está representada ao longo 
de todas as dimensões. Conceitualmente, esta medida é 
similar à medida de comunalidade de análise fatorial (ver 
Capítulo 3). 


Avaliação da associação entre categorias 

A segunda tarefa na interpretação é identificar a associa- 
ção de uma categoria com outras, o que pode ser feito vi- 
sualmente ou por meio de medidas empíricas. Qualquer 
que seja a técnica empregada, o pesquisador deve primei- 
ramente escolher os tipos de comparação a serem feitas e 
então a normalização adequada para a comparação sele- 
cionada. Os dois tipos de comparação são: 


1. Entre categorias da mesma linha ou coluna. Aqui o foco é 
apenas sobre linhas ou colunas, como quando se examinam 
as categorias de uma escala para ver se elas podem ser com- 
binadas. Esses tipos de comparações podem ser feitos dire- 
tamente a partir de qualquer análise de correspondência. 

2. Entre linhas e colunas. Uma tentativa de relacionar a asso- 
ciação entre uma categoria de linha e uma de coluna. Este 
tipo mais comum de comparação relaciona categorias ao 
longo de dimensões (como em nosso exemplo anterior, ven- 
das de produtos associadas com categorias etárias). Contu- 
do, desta vez há algum debate na adequação da compara- 
ção entre categorias de linha e de coluna. Em um sentido 
estrito, distâncias entre pontos representando categorias só 
podem ser feitas dentro de uma linha ou coluna. É conside- 
rada inadequada a comparação direta de uma categoria de 
linha e uma de coluna. É apropriado fazer generalizações 
referentes às dimensões e à posição de cada categoria sobre 
tais dimensões. Assim, a posição relativa de categorias de 
linha e coluna pode ser definida dentro dessas dimensões, 
mas não deve haver comparação direta. 

Alguns programas de computador fornecem um proce- 
dimento de normalização para viabilizar essa comparação 
direta. Se apenas um procedimento de normalização de li- 
nha ou coluna está disponível, técnicas alternativas são pro- 
postas para tornar todas as categorias comparáveis [2, 21], 
mas ainda há discordâncias quanto ao seu sucesso [12]. Nos 
casos em que as comparações diretas não são possíveis, a 
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correspondência geral ainda vale e padrões específicos po- 
dem ser distinguidos. 


Os objetivos da pesquisa podem se concentrar na ava- 
liação das dimensões ou na comparação de categorias, e o 
pesquisador é encorajado a fazer ambas as interpretações 
já que elas reforçam uma a outra. Por exemplo, a com- 
paração de categorias de linha versus de coluna sempre 
pode ser complementada com a compreensão da natu- 
reza das dimensões para fornecer uma perspectiva mais 
abrangente do posicionamento das categorias em vez de 
simplesmente comparações específicas. Analogamente, 
a avaliação da comparação específica de categorias pode 
dar especificidade à interpretação das dimensões. 


Estágio 6: Validação dos resultados 


A natureza composicional da análise de correspondência 
fornece maior especificidade para o pesquisador validar 
os resultados. Fazendo isso, o pesquisador deve buscar 
avaliar duas questões-chave relativas à generalidade de 
dois elementos: 


e Amostra. Como ocorre com todas as técnicas MDS, deve-se 
enfatizar a garantia da generalidade por meio de análises de 
subamostras ou múltiplas amostras. 

e Objetos. A generalidade dos objetos (representada indivi- 
dualmente e como um conjunto pelas categorias) também 
deve ser estabelecida. A sensibilidade dos resultados à adi- 
ção ou eliminação de uma categoria pode ser avaliada. A 
meta é avaliar se a análise depende de apenas poucos obje- 
tos e/ou atributos. 


Em qualquer caso, o pesquisador deve entender o 
verdadeiro significado dos resultados em termos das 
categorias sendo analisadas. A natureza inferencial da 
análise de correspondência, como outros métodos MDS, 
requer estrita confiança na representatividade e genera- 
lidade da amostra de respondentes e objetos (categorias) 
sob análise. 


Visão geral da análise de correspondência 


A análise de correspondência apresenta ao pesquisador 
diversas vantagens, variando da natureza generalizada 
dos dados de entrada ao desenvolvimento de mapas per- 
ceptuais únicos: 


e Asimples tabulação cruzada de múltiplas variáveis categó- 
ricas, como atributos de produtos versus marcas, pode ser 
representada em um espaço perceptual. Essa abordagem 
permite ao pesquisador analisar as respostas existentes 
ou reunir respostas no tipo menos restritivo de medida, o 
nível categórico ou nominal. Por exemplo, o respondente 
precisa avaliar somente com respostas do tipo sim ou não 
um conjunto de objetos quanto a alguns atributos. Essas 
respostas podem então ser agregadas em uma tabela cru- 
zada e analisadas. Outras técnicas, como a análise fatorial, 
exigem avaliações na escala intervalar de cada atributo 
para cada objeto. 


e ACA retrata não somente as relações entre as linhas e 
colunas, mas também as relações entre as categorias de 
linhas ou colunas. Por exemplo, se as colunas fossem atri- 
butos, múltiplos atributos próximos teriam perfis similares 
ao longo de produtos, formando um grupo de atributos 
muito semelhante a um fator de análise de componentes 
principais. 

e ACA pode fornecer uma visão conjunta de categorias das 
linhas e colunas na mesma dimensionalidade. Certas modi- 
ficações de programas permitem comparações entre pontos 
nos quais a proximidade relativa está diretamente relacio- 
nada com a maior associação entre pontos separados [1,21]. 
Quando essas comparações são possíveis, permitem que ca- 
tegorias das linhas e colunas sejam examinadas simultanea- 
mente. Uma análise desse tipo capacitaria o pesquisador a 
identificar grupos de produtos caracterizados por atributos 
em grande proximidade. 


Junto com as vantagens da CA, porém, surgem algu- 
mas desvantagens ou limitações. 


e A técnica é descritiva e nada adequada ao teste de hipó- 
teses. Se a relação quantitativa de categorias é desejada, 
métodos como modelos log-lineares são sugeridos. A CA é 
mais adequada à análise exploratória de dados. 

e ACA, como acontece com muitos métodos de redução de 
dimensionalidade, não dispõe de procedimento para deter- 
minar conclusivamente o número apropriado de dimensões. 
Como ocorre com métodos similares, o pesquisador deve 
equilibrar interpretabilidade com parcimônia da represen- 
tação dos dados. 


REGRAS PRÁTICAS 9-4 


Análise de correspondência 


A análise de correspondência (CA) é mais adequada 
para pesquisa exploratória e não é adequada para teste 
de hipóteses 

A CA é uma forma de técnica composicional que 
demanda especificação de objetos e atributos a serem 
comparados 

A análise de correspondência é sensível a observações 
atípicas, as quais devem ser eliminadas antes de se usar 
tal técnica 

O número de dimensões a serem mantidas na solução 


se baseia em: 


e Dimensões com inércia (autovalores) maiores que 
0,2 

e Dimensões suficientes para atender os objetivos da 
pesquisa (geralmente duas ou três) 

Dimensões podem ser “nomeadas” com base na 

decomposição de medidas de inércia ao longo de uma 

dimensão: 

e Esses valores mostram a extensão de associação 
para cada categoria individualmente com cada 
dimensão 

e Elas podem ser usadas para descrição como as 
cargas em análise fatorial 
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e A técnica é bastante sensível a dados atípicos, em termos de 
linhas ou colunas (p.ex., atributos ou marcas). Além disso, 
para fins de generalização, o problema de objetos ou atribu- 
tos omitidos é crítico. 


No geral, a análise de correspondência provê uma 
valiosa ferramenta analítica para um tipo de dado 
(não-métrico) que normalmente não é o ponto focal de 
técnicas multivariadas. A análise de correspondência 
também fornece ao pesquisador uma técnica composi- 
cional complementar ao MDS, para tratar de questões 
nas quais a comparação direta de objetos e atributos é 
preferível. 


ILUSTRAÇÃO DO MDS E DA . 
ANALISE DE CORRESPONDENCIA 


Para demonstrar o uso de técnicas MDS, examinamos da- 
dos reunidos em diversas entrevistas com representantes 
de companhias a partir de uma amostra representativa de 
clientes em potencial. No decorrer da análise do mapea- 
mento perceptual, aplicamos métodos decomposicionais 
(MDS) e composicionais (análise de correspondência). A 
discussão prossegue em quatro seções: 


1. Exame dos três estágios iniciais do processo de construção 
do modelo (objetivos da pesquisa, planejamento da pesqui- 
sa e suposições) que são comuns aos dois métodos 

2. Discussão dos próximos dois estágios (estimação de modelo 
e interpretação) para métodos decomposicionais de MDS 

3. Discussão dos mesmos dois estágios para o método com- 
posicional (análise de correspondência) aplicado à mesma 
amostra de respondentes 

4. Uma olhada no sexto estágio do processo de construção de 
modelo (validação) por meio de comparação dos resultados 
dos dois tipos de métodos. 


A aplicação de técnicas composicionais e decomposi- 
cionais permite ao pesquisador conquistar visões exclu- 
sivas de cada técnica enquanto também estabelece uma 
base de comparação entre cada método. 


Estágio 1: Objetivos do 
mapeamento perceptual 


Um propósito comum da pesquisa que lida com mapea- 
mento perceptual é explorar a imagem e competitivida- 
de de uma firma. Essa exploração inclui a abordagem de 
percepções de um conjunto de firmas no mercado, bem 
como uma investigação de preferências entre clientes em 
potencial. 


Neste exemplo, a HBAT emprega técnicas de mapea- 
mento perceptual em um plano de duas fases: 


1. Identificação da posição de HBAT em um mapa 
perceptual de grandes competidores no mercado 


com uma compreensão das comparações de dimen- 
sões usadas por clientes em potencial 

2. Avaliação das preferências por HBAT relativamen- 
te a competidores importantes 


Concentra-se interesse particular no exame das di- 
mensões de avaliação que possam ser mais subjetivas 
ou afetivas na composição a ser medida por escalas 
convencionais. Além disso, a intenção é criar um úni- 
co mapa perceptual geral pela combinação de posições 
de objetos e sujeitos, tornando muito mais diretas as 
posições relativas de objetos e clientes para análise de 
segmentação 


Na busca desses objetivos, o pesquisador deve abor- 
dar três questões fundamentais que ditam o caráter bá- 
sico dos resultados: objetos a serem considerados para 
comparação, o uso de dados de preferência ou de simi- 
laridade, e o emprego de análise desagregada ou agre- 
gada. Cada uma dessas questões será tratada na discus- 
são a seguir. 


Identificação de objetos para inclusão 

Uma decisão crítica para qualquer análise de mapa per- 
ceptual é a seleção dos objetos a serem comparados. Uma 
vez que julgamentos são feitos baseados na similaridade 
de um objeto com outro, a inclusão ou exclusão de objetos 
pode ter um grande impacto. Por exemplo, a exclusão de 
uma firma com características ímpares em relação a ou- 
tras pode ajudar a revelar comparações entre empresas ou 
até de dimensões não detactadas de outra forma. Analo- 
gamente, a exclusão de firmas de destaque ou relevantes 
sob outra perspectiva pode afetar os resultados de manei- 
ra semelhante. 


Em nosso exemplo, os objetos de estudo são a HBAT 
e seus nove principais concorrentes. Para entender as 
percepções dessas companhias concorrentes, executi- 
vos de nível médio que representam potenciais clientes 
são pesquisados quanto às suas percepções da HBAT e 
de concorrentes. Espera-se que os mapas perceptuais 
resultantes retratem o posicionamento da HBAT no 
mercado. 


Análise baseada em dados de 

similaridade ou de preferência 

A escolha de dados de similaridade ou de preferência de- 
pende dos objetivos básicos da análise. Dados de similari- 
dade fornecem a comparação mais direta de objetos com 
base em seus atributos, enquanto dados de preferência 
permitem uma avaliação direta do sentimento do respon- 
dente em relação a um objeto. É possível, através do uso 
de múltiplas técnicas, combinar os dois tipos de dados se 
ambos são coletados. 
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Para esta análise, reunir tanto dados de similaridade quanto 
de preferência viabiliza aos pesquisadores tratar de cada um 
dos objetivos de pesquisa já mencionados. Dados de simi- 
laridade são o tipo básico de informação usada na análise, 
com dados de preferência usados em análises suplementa- 
res para avaliação de ordem de preferência entre objetos. 


Uso de uma análise desagregada ou agregada 

A decisão final é sobre o uso de análise agregada ou desa- 
gregada individualmente ou em comum. Análise agregada 
fornece uma perspectiva geral sobre a amostra como um 
todo em uma só análise, com mapas perceptuais represen- 
tando as percepções compostas de todos os respondentes. 
Análise desagregada permite uma análise individualizada, 
na qual todos os respondentes podem ser retratados com 
seus próprios mapas perceptuais. Também é possível com- 
binar esses dois tipos de análise de forma que resultados 
individuais são retratados em conjunto com os resultados 
agregados. 


Neste exemplo da HBAT, a maior parte da análise será 
conduzida no nível agregado sempre que possível, ape- 
sar de que em certos casos os resultados desagregados 
também serão apresentados. Os resultados agregados 
se aproximam mais dos objetivos da pesquisa, os quais 
são um retrato geral da HBAT em relação aos maiores 
concorrentes. Se a pesquisa subseqiiente fosse mais con- 
centrada em segmentação ou questões que diretamente 
envolvessem indivíduos, então a análise desagregada se- 
ria mais adequada. 


Tendo tratado desses três problemas, podemos pros- 
seguir com questões relativas ao planejamento específico 
de pesquisa e administração da análise de mapeamento 
perceptual. 


Estágio 2: Projeto de pesquisa do 
estudo do mapeamento perceptual 


Com os objetivos definidos para a análise de mapeamento 
perceptual, os pesquisadores da HBAT devem, a seguir, 
tratar de um conjunto de decisões focando aspectos de 
planejamento de pesquisa que definem os métodos usa- 
dos e as firmas específicas a serem estudadas. Fazendo 
isso, eles também definem os tipos de dados que precisam 
ser coletados para executar a análise desejada. Cada uma 
dessas questões é discutida na próxima seção. 


Seleção de métodos decomposicionais 

ou composicionais 

A escolha entre métodos decomposicionais (livres de 
atributos) ou composicionais (baseados em atributos) 
gira em torno da especificidade que o pesquisador deseja. 


Na abordagem decomposicional, o respondente fornece 
apenas percepções ou avaliações gerais a fim de prover a 
medida de similaridade mais direta. Contudo, o pesqui- 
sador fica com pouca evidência objetiva de como essas 
percepções são formadas ou da base em que elas são for- 
madas. Em contrapartida, a abordagem composicional 
fornece alguns pontos de referência (p. ex., atributos) 
quando avalia similaridades, mas aí devemos estar cientes 
dos problemas em potencial quando atributos relevantes 
são omitidos. 


Neste exemplo, uma combinação de técnicas decompo- 
sicionais e composicionais é empregada. Primeiro, téc- 
nicas MDS tradicionais usando medidas gerais de simi- 
laridade fornecem mapas perceptuais que podem então 
ser interpretados usando dados adicionais de atributos e 
de preferência. Além disso, um método composicional 
(análise de correspondência) é utilizado como aborda- 
gem complementar no mapeamento perceptual, contri- 
buindo para sua habilidade de simultaneamente retratar 
firmas e atributos em um só mapa. 


Seleção de firmas para análise 

Ao selecionar empresas para análise, o pesquisador deve 
resolver duas questões. Primeiro, será que todas as firmas 
são comparáveis e relevantes para os propósitos deste es- 
tudo? Segundo, o número de firmas incluídas é suficiente 
para retratar a dimensionalidade desejada? O planeja- 
mento da pesquisa para tratar de cada questão é discutido 
aqui. 


Este estudo inclui nove concorrentes, mais a HBAT, re- 
presentando todas as principais firmas nesta indústria e 
tendo coletivamente mais de 85% de todas as vendas. 
Além disso, elas são consideradas representativas de 
todos os potenciais segmentos existentes no mercado. 
Todas as demais firmas não incluídas na análise são ti- 
das como concorrentes secundários em relação a uma ou 
mais das empresas já incluídas. 

Incluindo 10 empresas, os pesquisadores podem es- 
tar razoavelmente certos de que mapas perceptuais de 
duas dimensões podem ser identificados e retratados. 
Apesar de isso envolver uma tarefa de avaliação um 
pouco extensa por parte dos respondentes, foi consi- 
derado necessário incluir este conjunto de firmas para 
permitir aos pesquisadores uma estrutura multidimen- 
sional dentro da qual eles descrevam informações de 
atributos e preferência. 


Métodos não-métricos versus métricos 

A escolha entre métodos não-métricos e métricos se ba- 
seia no tipo de análise a ser executada (p.ex., composi- 
cional ou decomposicional) e nos programas a serem 
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utilizados. Em alguns casos, as exigências por programas 
específicos (p. ex., a análise de correspondência) ditam a 
abordagem, mas na maioria das vezes ambas as opções es- 
tão disponíveis. 


No estudo HBAT, ambos os métodos, métricos e não- 
métricos, são usados. As análises de escalonamento mul- 
tidimensional são executadas exclusivamente com dados 
métricos (avaliações de similaridades, preferências e de 
atributos). A análise de correspondência executa uma 
análise não-métrica usando dados na forma de escores 
cruzados de frequência. 


Coleta de dados de similaridade e de preferência 
Uma consideração importante na decisão sobre o uso de 
similaridades ou preferências tem a ver com os objetivos 
da pesquisa: a análise se concentra na compreensão sobre 
como os objetos se comparam conforme os antecedentes 
de escolha (ou seja, similaridades baseadas em atributos 
de objetos) ou segundo os resultados da escolha (ou seja, 
preferências)? Ao escolher uma abordagem, o analis- 
ta deve então inferir sobre a outra por meio de análise 
adicional. Por exemplo, se similaridades são escolhidas 
como os dados de entrada, o pesquisador ainda está incer- 
to sobre quais escolhas seriam feitas em qualquer tipo de 
decisão. Analogamente, se preferências são analisadas, o 
pesquisador não tem base direta para entender os deter- 
minantes de escolha a menos que alguma análise adicio- 
nal seja realizada. 


O estudo da imagem da HBAT é constituído de entre- 
vistas em profundidade com 18 administradores de nível 
médio de diferentes empresas. A partir dos objetivos da 
pesquisa, a principal meta é compreender as semelhan- 
ças de firmas com base em seus atributos. Logo, atenção 
é dada a dados de similaridade para uso em análise de 
escalonamento multidimensional e em avaliações não- 
métricas de atributos para a análise de correspondência. 
No decorrer das entrevistas, entretanto, tipos adicionais 
de dados foram coletados para uso na análise MDS, in- 
cluindo avaliações de atributos de empresas e preferên- 
cias por empresas em diferentes situações de compra. 


Dados de similaridades 

O ponto de partida para a coleta de dados para a análise 
MDS foi obter as percepções dos respondentes quanto à 
similaridade ou dissimilaridade entre a HBAT e nove em- 
presas concorrentes no mercado. 


Julgamentos de similaridades foram feitos com a abor- 
dagem de comparação de pares de objetos. Os 45 pares 
de empresas [(10 x 9)/2] foram apresentados aos res- 


pondentes, os quais indicaram o quanto umas são pare- 
cidas com as outras em uma escala de 9 pontos, sendo 
1 “nada similares” e 9 “muito similares”. Note que os 
valores têm de ser transformados porque valores cres- 
centes para avaliações de similaridades indicam maior 
semelhança, o oposto de uma medida de similaridade 
baseada em distância. 


Avaliações de atributos 

Além dos julgamentos de similaridades, as avaliações de 
cada empresa em uma série de atributos foram obtidas 
para fornecer algum meio objetivo de descrição das di- 
mensões identificadas nos mapas perceptuais. Essas ava- 
liações, conseguidas com dois métodos, seriam usadas em 
ambas as análises, MDS e de correspondência. 


Oito dos 10 atributos identificados como componentes 
dos quatro fatores do Capítulo 3 foram escolhidos para 
este estudo. Os 8 atributos incluídos foram X, Qualidade 
do Produto; X, Suporte Técnico; X,, Anúncio; X,, Ima- 
gem da Equipe de venda; X,, Preço Competitivo; X,, 
Garantia e Reclamações; X,, Encomenda e Cobrança; e 
X,, Velocidade de Entrega. 

Dois dos atributos do conjunto original de 10 foram 
eliminados nesta análise. Primeiro, X,, referente a Co- 
mércio Eletrônico, não foi usado porque cerca de me- 
tade das firmas não tinha uma presença de comércio em 
forma eletrônica. Além disso, X,, Solução de Reclama- 
ção, que é fortemente baseado em experiência, também 
foi omitido porque a avaliação feita por aqueles que não 
são clientes seria difícil para os respondentes. 

Para as avaliações métricas usadas em MDS, cada fir- 
ma foi avaliada em uma escala de 6 pontos quanto a cada 
atributo. Para a análise de correspondência, avaliações 
não-métricas foram coletadas solicitando-se que cada 
respondente escolhesse as firmas melhor caracterizadas 
por conta de cada atributo. Como no método “escolha 
qualquer um” [14, 15], o respondente poderia selecionar 
qualquer número de firmas para cada atributo. 


Avaliações de preferência 

O tipo final de dados avaliou as preferências de cada res- 
pondente em um contexto específico de escolha. Esses da- 
dos devem ser usados em conjunto com os mapas percep- 
tuais derivados no escalonamento multidimensional para 
fornecer uma visão sobre a correspondência de semelhan- 
ça e julgamentos de preferência. 


Três diferentes tipos de situação de compra — uma 
recompra simples, uma recompra modificada e uma 
situação de nova compra — foram avaliados pelos res- 
pondentes. Em cada situação, os respondentes classi- 
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ficaram as empresas em ordem de preferência para 
aquele contexto particular de compra. Por exemplo, na 
situação de recompra simples, o respondente indicou a 
empresa preferida para a simples recompra de produ- 
tos (posto de ordenação = 1), a próxima preferida (pos- 
to de ordenação = 2) e assim por diante. Preferências 
semelhantes foram reunidas para as duas situações de 
compra restantes. 


Estágio 3: Suposições no 
mapeamento perceptual 


As suposições de MDS e CA lidam principalmente com a 
comparabilidade e representatividade dos objetos avalia- 
dos e dos respondentes. As técnicas em si impõem poucas 
limitações aos dados, mas o sucesso delas se baseia em di- 
versas características dos dados. 

Com relação à amostra, o plano amostral enfatizou a 
obtenção de uma amostra representativa de clientes da 
HBAT. Além disso, tomou-se cuidado para obter res- 
pondentes de posição e conhecimento de mercado com- 
paráveis. Como a HBAT e as outras empresas atendem 
um mercado bastante distinto, todas as firmas avaliadas 
no mapeamento perceptual devem ser conhecidas, garan- 
tindo-se que discrepâncias de posicionamento possam ser 
atribuídas a diferenças perceptuais entre respondentes. 


Escalonamento multidimensional: 
Estágios 4e 5 


Após ter especificado as 10 empresas a serem incluídas no 
estudo de imagem, a administração da HBAT especificou 
que as duas abordagens, decomposicional (MDS) e com- 


posicional (CA), deveriam ser empregadas para construir 
os mapas perceptuais. Primeiro discutimos diversas técni- 
cas decomposicionais, e então examinamos uma aborda- 
gem composicional para mapeamento perceptual. 


Estágio 4: Obtenção de resultados 

MDS e avaliação do ajuste geral 

O processo de desenvolvimento de um mapa perceptual 
é fundamental para uma solução MDS, mas pode variar 
bastante em termos dos tipos de dados de entrada e aná- 
lises associadas executadas. Nesta seção discutimos pri- 
meiramente o processo de desenvolvimento de um mapa 
perceptual com base em julgamentos de similaridade. Em 
seguida, com o mapa perceptual estabelecido, examina- 
mos o processo para incorporação de julgamentos de pre- 
ferência no mapa perceptual já existente. 


Desenvolvimento e análise do mapa perceptual. O IN- 
DSCAL [4] foi usado para desenvolver um mapa percep- 
tual, composto ou agregado, e as medidas das diferenças 
entre respondentes em suas percepções. Os 45 julgamen- 
tos de similaridades dos 18 respondentes foram incluídos 
como matrizes separadas, mas uma matriz de escores mé- 
dios foi calculada para ilustrar o padrão geral de simila- 
ridades (ver Tabela 9-4). A tabela também especifica as 
altas similaridades (maiores que 6,0), bem como a menor 
similaridade para cada empresa. Com essas relações, os 
padrões básicos podem ser identificados e estão disponí- 
veis para comparação com o mapa resultante. 


Estabelecimento da dimensionalidade apropriada. A 
primeira análise dos resultados do MDS é determinar a 
dimensionalidade apropriada e retratar os resultados em 
um mapa perceptual. Para fazer isso, o pesquisador deve 


TABELA 9-4 Médias das avaliações de similaridade para HBAT e nove firmas concorrentes 


Firma 
Firma HBAT A B Cc D E F G H | 
HBAT 0,00 
A 6,61 0,00 
B 5,94 5,39 0,00 
(6; 2,33 2,61 3,44 0,00 
D 2,56 2,56 4,11 6,94 0,00 
E 4,06 2,39 2,17 4,06 2,39 0,00 
F 2,50 3,50 4,00 2,22 2,17 4,06 0,00 
G 2,33 2,39 3,72 2,67 2,61 3,67 2,28 0,00 
H 2,44 4,94 6,61 2,50 7,06 5,61 2,83 2,56 0,00 
| 6,17 6,94 2,83 2,50 2,50 3,50 6,94 2,44 2,39 0,00 
Avaliações de similaridade máxima e mínima 
eitaledade A,| Bam H D CH Nenhum | Nenhum BD BAT 
maior que 6,0 | A,F 
 Monor c,G EG E F F B c F ] H 
similaridade 


Nota: Avaliações de similaridade estão em uma escala de 9 pontos (1 = nada semelhantes, 9 = muito semelhantes). 
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considerar os índices de ajuste em cada dimensionalidade | , . 
e a própria habilidade em interpretar a solução para avaliar se alguma conclusão substancialmente di- 


A Tabela 9-5 mostra os índices de ajuste para soluções 
de duas a cinco dimensões (uma solução unidimensio- 
nal não foi considerada uma alternativa viável para 10 
empresas). Como mostra a tabela, existe uma melhora 
substancial na mudança de duas para três dimensões, 
sendo que depois disso a melhora diminui e perma- 
nece consistente quando aumentamos o número de 
dimensões. Equilibrando essa melhora no ajuste com 
a crescente dificuldade de interpretação, as soluções 
bidimensional ou tridimensional parecem ser as mais 
adequadas. Para fins de ilustração, a solução bidi- 
mensional é escolhida para posterior análise, mas os 
métodos que aqui discutimos poderiam ser aplicados 
à solução tridimensional com a mesma facilidade. O 
pesquisador é encorajado a explorar outras soluções 


ferente seria alcançada com base na dimensionalidade 
escolhida. 


Criação do mapa perceptual. Com a dimensionali- 
dade estabelecida em duas dimensões, o próximo passo é 
posicionar cada objeto (firma) no mapa perceptual. Lem- 
bre que a base para o mapa (neste caso, similaridade) de- 
fine como os objetos podem ser comparados. 


O mapa perceptual agregado bidimensional é exibido na 
Figura 9-12. A HBAT é mais proximamente associada 
à empresa A, com respondentes considerando-as quase 
idênticas. Outros pares de empresas consideradas alta- 
mente similares com base em sua proximidade são E e 
G,DeH,eFeI. Comparações também podem ser feitas 
entre essas empresas e a HBAT. A HBAT difere de C, 


(Continua) 
TABELA 9-5 Avaliação do ajuste geral do modelo e determinação da dimensionalidade adequada 
Medidas médias de ajuste” 

Dimensionalidade da solução Desajuste” Variação percentual Rê Variação percentual 

5 0,20068 — 0,6303 — 

4 0,21363 6,4 0,5557 11,8 

3 0,23655 10,7 0,5007 9,9 

2 0,30043 27,0 0,3932 21,5 


“Média ao longo de 18 soluções individuais 
ºFórmula de desajuste de Kruskal 


“Proporção de avaliações de similaridade original explicadas por dados (distâncias) escalonados do mapa perceptual 
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FIGURA 9-12 Mapa perceptual de HBAT e principais concorrentes. 
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(Continuação) 
E e G principalmente na dimensão II, ao passo que a di- 


mensão I diferencia a HBAT mais claramente das empre- 
sas B, C, D e H em uma direção, e das empresas Fe Tem 
uma outra direção. Todas essas diferenças são refletidas 
em suas posições relativas no mapa perceptual. Compara- 
ções parecidas podem ser feitas entre todos os conjuntos 
de empresas. Para entender as fontes dessas diferenças, 
porém, o pesquisador deve interpretar as dimensões. 


Antes de prosseguir com a adição de dados de prefe- 
rência à análise, o pesquisador deve examinar os resul- 
tados para identificar quaisquer observações atípicas em 
potencial e verificar a suposição de homogeneidade de 
respondentes. Cada uma dessas questões é tratada antes 
que o processo de interpretação comece. 


Avaliação de potenciais observações atípicas. No 
processo de seleção da dimensionalidade adequada, uma 
medida geral de ajuste (desajuste) foi examinada. No en- 
tanto, tal medida não retrata de forma alguma o ajuste da 
solução para comparações individuais. Tal análise pode 
ser feita visualmente por meio de um diagrama de dis- 
persão de distâncias reais (valores escalonados de simila- 
ridade) versus distâncias ajustadas do mapa perceptual. 
Cada ponto representa um único julgamento de simila- 
ridade entre dois objetos, com ajuste pobre espelhando 
pontos atípicos no gráfico. Dados atípicos são um con- 
junto de julgamentos de similaridade que refletem consis- 
tentemente ajuste ruim para um objeto ou respondente 
individual. Se um conjunto consistente de objetos ou in- 


divíduos é identificado como atípico, ele pode ser consi- 
derado para eliminação. 


A Figura 9-13 representa o diagrama de dispersão de va- 
lores de similaridade versus as distâncias derivadas do 
programa MDS. Neste caso, não surge qualquer padrão 
consistente de pontos atípicos para uma firma ou respon- 
dente em especial para torná-lo candidato à eliminação 
da análise. 


Teste da suposição de homogeneidade para respon- 
dentes. Além de desenvolver o mapa perceptual com- 
posto, o INDSCAL também fornece os meios para ava- 
liar uma das suposições de MDS, a homogeneidade das 
percepções dos respondentes. Para cada respondente, 
calculam-se pesos indicativos da correspondência de seu 
próprio espaço perceptual com o mapa perceptual agre- 
gado. Esses pesos fornecem uma medida de comparação 
entre os respondentes, pois os respondentes com pesos 
similares têm mapas perceptuais individuais similares. O 
INDSCAL também fornece uma medida de ajuste para 
cada sujeito, correlacionando os escores computados com 
as avaliações de similaridades originais do respondente. 


A Tabela 9-6 contém os pesos e medidas de ajuste para 
cada respondente, e a Figura 9-14 é uma representação grá- 
fica dos respondentes individuais baseada em seus pesos. O 
exame dos pesos (Tabela 9-6) e da Figura 9-14 revela que 


os respondentes são bem homogêneos em suas percepções, 
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Valores de similaridade escalonados 


FIGURA 9-13 Diagrama de dispersão de ajuste linear. 
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TABELA 9-6 Medidas de diferenças individuais em mapeamento perceptual: medidas de ajuste e pesos dimensionais para 
respondentes específicos 


Medidas de ajuste Pesos dimensionais 
Sujeito Desajuste” Rê Dimensão | Dimensão II 
1 0,358 0,274 0,386 0,353 
2 0,297 0,353 0,432 0,408 
3 0,302 0,378 0,395 0,472 
4 0,237 0,588 0,572 0,510 
5 0,308 0,308 0,409 0,375 
6 0,282 0,450 0,488 0,461 
7 0,247 0,547 0,546 0,499 
8 0,302 0,332 0,444 0,367 
9 0,320 0,271 0,354 0,382 
10 0,280 0,535 0,523 0,511 
11 0,299 0,341 0,397 0,429 
12 0,301 0,343 0,448 0,378 
13 0,292 0,455 0,497 0,456 
14 0,302 0,328 0,427 0,381 
15 0,290 0,371 0,435 0,426 
16 0,311 0,327 0,418 0,390 
17 0,281 0,433 0,472 0,458 
18 0,370 0,443 0,525 0,409 
Média”? 0,300 0,393 


Média ao longo de 18 soluções individuais 
ºFórmula de desajuste de Kruskal 
“Proporção de avaliações de similaridade original explicadas por dados escalonados (distâncias) do mapa perceptual 
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FIGURA 9-14 Pesos individuais de sujeitos. 
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(Continuação) 
pois os pesos mostram poucas diferenças relevantes em 


cada dimensão, e nenhum agrupamento distinto de indiví- 
duos emerge. Na Figura 9-14 todos os pesos individuais re- 
caem sobre uma reta, indicando um peso consistente entre 
as dimensões I e II. 

A distância de cada peso individual em relação à ori- 
gem indica seu nível de ajuste com a solução. Os melhores 
ajustes são mostrados pelas maiores distâncias da origem. 
Logo, os respondentes 4, 7 e 10 têm o mais alto ajuste, e os 
respondentes 1 e 9, o mais baixo ajuste. Os valores de ajuste 
exibem consistência relativa tanto em desajuste quanto em 
Rº, com valores médios de 0,300 (desajuste) e 0,393 (R”). 
Além disso, todos os respondentes são bem representados 
pelo mapa perceptual composto, sendo a menor medida de 
ajuste 0,27. Assim, nenhum indivíduo deve ser eliminado 
devido a pouco ajuste na solução bidimensional. 


Incorporação de preferências no mapa perceptual. Até 
agora, lidamos apenas com julgamentos de empresas 
baseados em similaridades, mas muitas vezes podemos 
querer estender a análise para o processo de tomada de 
decisões e entender as preferências do respondente pelos 
objetos (no caso, empresas). Para tanto, podemos empre- 
gar técnicas MDS adicionais que permitem a estimação de 
pontos ideais, a partir dos quais as preferências por obje- 
tos podem ser determinadas. 


Nesse exemplo, usamos um método externo de forma- 
ção de preferência (PREFMAP [6]) que utiliza os ma- 
pas perceptuais agregados obtidos na seção anterior e 
os combina com os julgamentos de preferência forne- 
cidos pelos respondentes. O resultado é a identificação 
de pontos ideais para indivíduos e para o respondente 
médio no mapa perceptual. 


Geração de avaliações de preferência. Preferências 
diferem de comparações de similaridade no sentido de 
que os respondentes abordam a questão de preferência 
entre objetos em um contexto específico de decisão. Tais 
avaliações podem diferir sensivelmente de julgamentos 
de similaridade ou entre contextos de decisão (ou seja, 
comprar um produto como presente para alguém versus 
para uso pessoal). É essencial que o contexto apropriado 
de decisão seja analisado para atender aos objetivos da 
pesquisa. 


Como descrito anteriormente, os respondentes foram 
solicitados a detalharem suas preferência quanto a fir- 
mas em três situações de compra. Aqui examinamos as 
preferências para firmas na nova situação de compra. 
Para fins de ilustração, examinamos as preferências de 
cinco respondentes. As ordenações de preferência para 
esses cinco respondentes são dadas na Tabela 9-7. 


Cálculo de pontos ideais. Usando o mapa percep- 
tual anteriormente obtido e as avaliações de preferência, 
o programa pode estimar pontos ideais tanto do ponto de 
vista vetorial quanto pontual. A principal diferença en- 
tre essas duas abordagens é seu método de interpretação, 
com os pontos ideais pontualmente representados sendo 
avaliados diretamente por sua proximidade com posições 
individuais de firmas, enquanto uma abordagem vetorial 
representa preferência com base em projeções para o ve- 
tor (ver discussão anterior sobre esses dois métodos). 


Nessa situação, a administração da HBAT decidiu-se pelas 
representações pontuais, o que resultou na derivação de 


pontos ideais para os cinco respondentes, mais um ponto 
(Continua) 


TABELA 9-7 Dados de preferência da nova situação de compra para respondentes selecionados 


Firma 
Sujeito HBAT A B Cc D E F G H | Ajuste” 
2 3 5 6 7 4 10 8 1 9 
1 —0,867 —0,972 —0,920 —1,096 —1,095 —0,636 —0,264 —1,054 —0,854 -0,371 0,787 
5 2 Fá 6 9 3 4 1 10 8 
2 —1,049 —1,056 —0,622 —0,906 —0,642 —1,111 —0,879 —1,596 —0,413 —0,825 0,961 
4 1 8 7 6 9 3 5 10 2 
3 —0,894 —0,868 —0,448 -0,133 —0,106 —0,449 —0,726 —0,576 -0,132 —0,779 0,855 
4 3 10 2 7 8 6 1 9 5 
4 —1,098 —1,128 —0,736 —1,060 -0,813 —1,136 —0,822 —1,672 —0,544 —0,790 0,884 
4 1 8 7 9 3 5 2 10 6 
5 —0,905 —0,868 —0,401 —0,362 —0,188 —0,769 —0,870 —1,019 —0,126 —0,838 0,977 
NA NA NA NA NA NA NA NA NA NA 
Média -0,916 -0,931 —0,580 —0,668 —0,525 -0,776 —0,666 —1,140 —0,370 —0,674 0,990 


Nota: Valores no topo de cada célula são ordenações originais de preferência, enquanto a parte de baixo é a distância quadrada (com sinal) da firma até o ponto 


ideal. NA indica ordenações médias não disponíveis. 
“Ajuste é a correlação quadrada entre preferências e distâncias com sinal. 
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(Continuação) 
ideal para o sujeito médio. Os resultados são mostrados na 


Figura 9-15. As distâncias de cada empresa até os pontos 
ideais são fornecidas na Tabela 9-7. Valores menores indi- 
cam uma maior proximidade do ponto ideal. 


Interpretação da solução baseada em preferência. A 
inclusão de julgamentos de preferência é uma tentativa de 
estender o mapa perceptual com base em julgamentos de 
similaridade em um contexto de decisão. Deve ser obser- 
vado que uma técnica alternativa é utilizar julgamentos 
de preferência como a base para o mapa perceptual, caso 
em que resultados diferentes podem ocorrer. Tal método, 
contudo, confina a interpretação a apenas um contexto es- 
pecífico de decisão, enquanto a abordagem descrita aqui 
usa o mapa perceptual mais generalizado radicado em si- 
milaridade em um contexto decisório específico. 


A Figura 9-15 retrata todos os respondentes que formam 
um grupo geral de certa forma agregado em torno da 
média, o que indica uma uniformidade geral em prefe- 
rências. No entanto, ainda podemos detectar diferenças 
de proximidade para o grupo como um todo tanto quan- 
to para empresas individuais. 


e Primeiro, o grupo como um todo está mais próximo das 
empresas C, D, Fe H, ao passo que a HBAT, A,B, E e 
G estão de alguma forma mais afastadas. Note que, nes- 


se caso, tanto a proximidade quanto a dimensionalidade 
são importantes. A suposição de uma análise externa é 
que quando você muda sua posição no mapa perceptual 
quanto às dimensões, pode mudar sua proximidade dos 
pontos ideais e sua ordem de preferência. 

e Em termos dos respondentes individuais, algumas asso- 
ciações próximas indicam maiores preferências. O res- 
pondente 1 tem uma associação relativamente próxima 
com a empresa F, como refletido em uma avaliação de 
preferência de 10 (ver Tabela 9-7). Para os responden- 
tes3e5,a grande proximidade com as empresas C, D e 
H corresponde a um padrão consistente de preferências 
mais elevadas, como se mostra na Tabela 9-7. Embora 
esse grupo de respondentes seja relativamente homogê- 
neo em suas preferências, como indicado por seu agru- 
pamento, a Figura 9-15 ainda retrata a posição relativa 
de cada empresa não apenas em percepção, mas agora 
também em preferência. 


Estágio 5: Interpretação dos resultados 

Logo que o mapa perceptual é estabelecido, podemos co- 
meçar o processo de interpretação. Como o procedimento 
INDSCAL usa apenas os julgamentos de similaridade ge- 
ral, a HBAT também reuniu avaliações de cada empresa 
em uma série de oito atributos descritivos de estratégias 
típicas seguidas nesta indústria. As avaliações para cada 
firma tiveram médias calculadas ao longo de responden- 
tes para uma única avaliação geral usada na descrição de 
cada firma. 
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FIGURA 9-15 Mapa de pontos ideais para respondentes selecionados e médios: situação de nova compra. 
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Como descrito no estágio 2, os oito atributos incluídos 
são X, Qualidade de Produto; X, Suporte Técnico; X,, 
Anúncio; X,, Imagem da Equipe de Venda; X,, Preço 
Competitivo; X,, Garantia e Reclamações; X,, Enco- 
menda e Cobrança; e X,; Velocidade de Entrega. Es- 
ses atributos representam as variáveis individuais que 
compõem os quatro fatores desenvolvidos no Capítulo 
3, excluindo X,, Comércio eletrônico, e X,, Solução de 
Reclamação. Os escores médios para cada firma são 
mostrados na Tabela 9-8. 


Uma abordagem subjetiva para interpretação. O pes- 
quisador pode levar a cabo diversas técnicas subjetivas 
para interpretação. Primeiro, as firmas podem ser carac- 
terizadas em termos de suas avaliações de atributos com 
atributos distintos identificados para cada empresa. Dessa 
maneira, cada firma é caracterizada sobre um conjunto 
de atributos, com o pesquisador relacionando os mesmos 
com a associação entre empresas, se possível. Interpretar 
as dimensões é mais complicado, no sentido de que o pes- 
quisador deve relacionar as posições das firmas com as di- 
mensões em termos de suas características. Em ambas as 
abordagens, porém, o pesquisador confia em julgamento 
pessoal para identificar as características distintas e então 
relacioná-las com as posições das firmas e a interpretação 
resultante das dimensões. 

Essas técnicas são mais apropriadas para uso em situa- 
ções nas quais os objetos e as características básicas são 
bem estabelecidos. Então o pesquisador usa conhecimen- 
to geral de relações existentes entre atributos e objetos 
para auxiliar na interpretação. Em situações nas quais o 
pesquisador deve desenvolver tais relações e associações 
a partir da análise em si, as abordagens objetivas descritas 
na próxima seção são recomendadas, pois elas fornecem 
um método sistemático para identificar as questões bási- 
cas envolvidas na interpretação de objetos e dimensões. 


A administração da HBAT teve acesso aos perfis de cada 
firma com base nos oito atributos (ver Tabela 9-8). No 
entanto, devido a uma vontade de evitar a introdução 
de qualquer viés na análise por conta de julgamento ou 
percepção pessoal, as abordagens subjetivas não foram 
usadas. Em vez disso, métodos objetivos seriam usados 
exclusivamente na fase de interpretação. 


Abordagens objetivas para interpretação. Para fornecer 
uma maneira objetiva de interpretação, PROFIT [3], um 
modelo vetorial foi usado para combinar as avaliações 
para as posições da firma no mapa perceptual com as ava- 
liações de atributo para cada objeto. A meta é identificar 
os atributos determinantes nos julgamentos de similarida- 
de feitos por indivíduos para determinar quais atributos 
melhor descrevem as posições perceptuais das firmas e as 
dimensões. 


Os resultados da aplicação dos dados de avaliação ao 
mapa perceptual composto são mostrados na Figura 9-16 
como três grupos ou dimensões distintas de atributos. O 
primeiro envolve X,; (Velocidade de Entrega), X,, (En- 
comenda e Cobrança) e X, (Qualidade do Produto), os 
quais estão todos apontados na mesma direção, e X,, 
(Preço Competitivo), que está na direção oposta à das 
demais três variáveis. Essa diferença na direção indica 
uma correspondência negativa de Competitividade de 
Preço em relação às outras três variáveis, o que é secun- 
dado pelas relações encontradas no Capítulo 3, onde X, 
e X,, formam um fator, mas com X, tendo uma carga 
negativa que indica uma relação negativa com X,,. Deve 
ser observado que X,, e X,; também são membros de 
um mesmo fator, o que apóia a proximidade dos mesmos 
nesta análise também. 

O segundo conjunto de variáveis reflete duas outras 
variáveis descobertas como representantes de uma di- 
mensão de suporte técnico (fator): X, (Suporte Técnico) 
e X,, (Garantia e Reclamações), junto com X,, (Anún- 
cio). Finalmente, X,, (Imagem da Equipe de Venda) 
anda quase perpendicularmente a todas as demais variá- 
veis, indicando em algum grau uma dimensão separada e 
distinta de avaliação. 


Interpretação das dimensões. Para interpretar as di- 
mensões, o pesquisador procura atributos proximamente 
alinhados em relação ao eixo. Como o mapa perceptual é 
uma representação pontual, os eixos podem ser rotacio- 
nados sem qualquer impacto sobre as posições relativas. 


Nesse caso, os dois grupos de atributos estão levemen- 
te inclinados em relação ao eixo original. No entanto, a 
leve rotação dos eixos (muito parecido com o que se faz 
em análise fatorial no Capítulo 3) resulta em um perfil 
consistente da dimensão I (horizontal), que consiste de 
serviço ao cliente (X,, e X,s) e valor do produto (X, e 
X,.) versus a dimensão II (vertical) de marketing (X,, e 
X,,) e suporte técnico (X, e X,,). Uma característica de 
destaque da segunda dimensão é a maneira na qual X,, 
(Imagem da Equipe de Venda) opera quase em contras- 
te com X,, (Anúncio), ainda que ambas sejam altamente 
relacionadas. Este resultado ocorre porque firmas são 
distintas nessas variáveis em separado ao invés de jun- 
tamente, em contraste com as outras variáveis que pa- 
reciam seguir as relações entre variáveis anteriormente 
observadas. 


Apesar de não ser realmente necessário realizar a rota- 
ção porque empresas podem ser comparadas diretamente 
quanto aos vetores de atributos, muitas vezes a rotação 
pode contribuir para uma compreensão mais fundamen- 
tal da dimensão percebida. A rotação é especialmente útil 
em soluções que envolvem mais de duas dimensões. 
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FIGURA 9-16 Mapa perceptual com representação vetorial de atributos. 


Caracterização das firmas. Para determinar os valo- 
res para qualquer empresa em um vetor de atributo, pre- 
cisamos calcular as projeções da empresa sobre o vetor. 
Para ajudar na interpretação, o programa PROFIT forne- 
ce valores de projeção para cada atributo. Esses valores 
fornecem uma posição relativa para cada objeto sobre o 
vetor de atributo. No entanto, os valores em si não são 
apresentados em termos da escala original do attributo. 
Para fornecer alguma base para comparação, médias do 
objeto para o atributo também são em geral consideradas. 


Os valores de projeção de atributos estão listados na se- 
gunda linha de valores para cada variável na Tabela 9-8. 
Também estão incluídas as avaliações originais (valores 
na primeira linha) para ver se o vetor representa bem as 
percepções reais dos respondentes. 

Em nosso exemplo, podemos examinar a corres- 
pondência das projeções com as avaliações de atributos 
para quaisquer atributos. Selecionemos as avaliações 


Xs Suporte técnico 

X4o Anúncio 

X4> Imagem da equipe de venda 
X43 Preço competitivo 

X44 Garantia e reclamações 

X46 Encomenda e cobrança 

X4g Velocidade de entrega 


em X, (Suporte Técnico). Se ordenarmos os objetos 
do maior para o menor, a ordem será C, D, H, G,B,lI, 
E, HBAT, Fe A. Usando as projeções vetoriais, per- 
cebemos que a ordem de empresas é C, D,H, G, E, 
B, A, HBAT, Fe I. Esta comparação demonstra uma 
correspondência relativamente próxima entre os valo- 
res originais e os calculados, particularmente entre as 
primeiras quatro firmas. Essa ordem é confirmada pela 
medida estatística de ajuste para cada atributo, que é a 
correlação entre as avaliações originais e as projeções 
vetoriais. No caso de Suporte Técnico, a correlação é 
de 0,829. 


O pesquisador não deve esperar um ajuste perfeito por 
várias razões. Primeiro, o mapa perceptual é baseado na 
avaliação geral, a qual pode não ser diretamente compará- 
vel com as avaliações. Segundo, as avaliações são subme- 
tidas ao cálculo da média ao longo dos respondentes, de 
modo que seus valores são determinados por diferenças 
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entre indivíduos, bem como diferenças entre empresas. 
Dados esses fatores, o nível de ajuste para os atributos é 
aceitável individual e coletivamente. 


Visão geral dos resultados decomposicionais 

Os métodos decomposicionais empregados neste estudo 
de imagem ilustram a inerente negociação e as vantagens 
e desvantagens resultantes de técnicas de escalonamento 
multidimensional livre de atributos. 


e Vantagem: O uso de julgamentos de similaridades gerais 
fornece um mapa perceptual baseado apenas nos critérios 
relevantes escolhidos por parte de cada respondente. O 
respondente pode fazer tais julgamentos com base em qual- 
quer conjunto de critérios considerados relevantes em uma 
única medida de similaridade geral. 


versus 


e Desvantagem: O emprego de uma técnica livre de atribu- 
tos dá origem, porém, à notável dificuldade de interpre- 
tação do mapa perceptual em termos de atributos espe- 
cíficos. O pesquisador é solicitado a inferir as bases para 
comparação entre objetos sem confirmação direta do res- 
pondente. 


O pesquisador usando tais métodos deve examinar os 
objetivos de pesquisa e decidir se os benefícios resultantes 
dos mapas perceptuais desenvolvidos através de aborda- 
gens livres de atributos são mais importantes do que as 
limitações impostas na interpretação. Podemos examinar 
os resultados da análise da HBAT para avaliarmos as ne- 
gociações, os benefícios e os custos. 


A HBAT pode obter muitas novas idéias sobre as per- 
cepções relativas da HBAT e das demais nove firmas. 
Em termos de percepções, a HBAT é a mais associada 
com a firma A e, um pouco, com as firmas B e IT. Alguns 
agrupamentos competitivos (p.ex., Fe I, Ee G) também 
devem ser considerados. Nenhuma empresa é considera- 
velmente distinta, de forma a ser considerada atípica. A 
HBAT pode ser considerada a média em diversos atri- 
butos (X,, X,.e X,s), mas tem escores menores em diver- 
sos atributos (X,, X,9€ X,,) em contraste com um eleva- 
do escore para o atributo X,,. Finalmente, a HBAT não 
tem vantagem real em termos de proximidade a pontos 
ideais de respondente, com outras empresas, como D, H 
e F, estando localizadas muito mais próximas aos pontos 
ideais para diversos respondentes. 


Esses resultados dão à HBAT uma visão não apenas 
de suas percepções, mas também das percepções dos 
outros concorrentes importantes no mercado. A habi- 
lidade de PROFTT neste exemplo para adequadamente 
descrever os objetos em termos do conjunto de atribu- 
tos reduz as desvantagens da abordagem livre de atri- 
butos. Lembre-se, porém, que o pesquisador não está 
garantido em termos de compreensão sobre quais atri- 


butos foram realmente usados no julgamento, estando 
certo apenas que esses atributos podem ser descritivos 
dos objetos. 


Análise de correspondência: Estágios 4 e 5 


Uma alternativa ao mapeamento perceptual livre de atri- 
butos é a análise de correspondência (CA), um método 
composicional baseado em medidas não-métricas (con- 
tagens de frequência) entre objetos e/ou atributos. Nes- 
te método baseado em atributos, o mapa perceptual é 
um espaço conjunto, que mostra tanto atributos quanto 
empresas em uma mesma representação. Além disso, as 
posições de empresas são relativas não apenas às outras 
empresas incluídas na análise, mas também aos atributos 
selecionados. 


Estágio 4: Estimação de uma 

análise de correspondência 

A preparação de dados e o procedimento de estimação 
para a análise de correspondência são semelhantes, em al- 
guns aspectos, ao processo de escalonamento multidimen- 
sional discutido anteriormente, com algumas exceções 
notáveis. Nas próximas seções, discutimos o método de 
coleta de dados usado no estudo de HBAT e, em seguida, 
as questões envolvidas no cálculo de similaridade e na de- 
terminação da dimensionalidade da solução. 


Coleta e preparação de dados. Uma característica única 
da análise de correspondência é o emprego de dados não- 
métricos para retratar relações entre categorias (objetos 
ou atributos). Uma abordagem comum para apresentação 
de dados é o emprego de uma matriz de tabulação cruza- 
da que relaciona os atributos (representados como linhas) 
com as avaliações de objetos/firmas (as colunas). Os va- 
lores representam o número de vezes que cada empresa 
é avaliada como sendo caracterizada por aquele atributo. 
Assim, frequências maiores indicam uma associação mais 
forte entre aquele objeto e o atributo em questão. 


No estudo HBAT, avaliações binárias de empresas fo- 
ram reunidas para cada firma em cada um dos oito atri- 
butos (ou seja, uma avaliação do tipo sim-não de cada 
firma sobre cada atributo). As entradas individuais na 
matriz de tabulação cruzada são o número de vezes que 
uma firma é avaliada como possuindo um atributo espe- 
cífico. Respondentes podem escolher qualquer número 
de atributos como caracterizando cada empresa. As fre- 
quências simples são fornecidas para cada firma ao longo 
de todo o conjunto de atributos na Tabela 9-9. 


Cálculo da medida de similaridade. A análise de corres- 
pondência é baseada em uma transformação do valor qui- 
quadrado em uma medida métrica de distância, que atua 
como uma medida de similaridade. O valor qui-quadrado 
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TABELA 9-9 Dados cruzados de frequência de descritores de atributos para HBAT e as nove firmas concorrentes 


Firma 

Variáveis HBAT A B Cc D E F G H I 

X, Qualidade do produto 6 6 14 10 22 8 7 4 14 4 
X; Suporte Técnico 15 18 9 2 3 15 16 7 8 8 
X, Anúncio 15 16 15 1 11 14 16 12 14 14 
X,» Imagem da equipe de venda 4 3 1 13 9 6 3 18 2 10 
X,3 Preço competitivo 15 14 6 4 4 15 14 13 7 13 
X, Garantia e reclamações 7 18 13 4 9 16 14 5 4 16 
Xe Encomenda e cobrança 14 14 10 11 11 14 12 13 10 14 
Xe Velocidade de entrega 16 13 8 13 9 17 15 16 6 12 


é calculado como a frequência real de ocorrência menos a 
frequência esperada. Assim, um valor negativo indica, nesse 
caso, que uma empresa foi avaliada menos frequentemente 
do que o esperado. O valor esperado para uma célula (qual- 
quer combinação de empresa-atributo na tabulação cruzada) 
é baseado na fregiiência com que a empresa foi avaliada em 
outros atributos e a fregqiiência com que outras empresas fo- 
ram avaliadas naquele atributo. (Em termos estatísticos, o 
valor esperado é baseado nas probabilidades marginais de 
linha [atributo] e coluna [empresa].) 


A Tabela 9-10 contém as distâncias qui-quadrados trans- 
formadas (métricas) para cada célula da tabulação cru- 
zada da Tabela 9-9. Valores positivos elevados indicam 
um alto grau de correspondência entre o atributo e a em- 
presa, e valores negativos têm uma interpretação opos- 
ta. Por exemplo, os valores elevados para a HBAT e as 
empresas A e F com o atributo de suporte técnico (X,) 
indicam que elas devem ficar próximas no mapa percep- 
tual, se possível. Do mesmo modo, os valores negativos 
elevados para as empresas C e D na mesma variável in- 
dicariam que suas posições devem ficar afastadas da lo- 
calização do atributo. 


Determinação da dimensionalidade da solução. A análi- 
se de correspondência tenta satisfazer todas essas relações 
simultaneamente produzindo dimensões que representam 


as distâncias qui-quadrado. Para determinar a dimensio- 
nalidade da solução, o pesquisador examina o percentual 
cumulativo de variação explicada, de maneira parecida 
com o que se faz em análise fatorial, e determina a dimen- 
sionalidade adequada. O pesquisador equilibra o desejo 
por explicação aumentada ao adicionar dimensões extras 
versus interpretabilidade, pela criação de maior complexi- 
dade com cada dimensão somada. 


A Tabela 9-11 contém os autovalores e percentuais de 
variação cumulativa e explicada para cada dimensão até 
o máximo de sete. Uma solução bidimensional nessa si- 
tuação explica 86% da variação, ao passo que aumentar 
para uma solução tridimensional acrescenta apenas 10% 
à explicação. Ao comparar a variância adicional explica- 
da em relação à complexidade crescente na interpreta- 
ção dos resultados, uma solução bidimensional é consi- 
derada adequada para análise posterior. 


Estágio 5: Interpretação dos resultados da CA 
Com o número de dimensões definido, o pesquisador deve 
prosseguir com uma interpretação do mapa perceptual 
obtido. Fazendo isso, pelo menos três questões devem ser 
tratadas: posicionamento de categorias linha e/ou coluna, 
caracterização das dimensões, e avaliação da adequação 
de ajuste de categorias individuais. Cada uma delas é dis- 
cutida nas próximas seções. 


TABELA 9-10 Medidas de similaridade em análise de correspondência: distâncias qui-quadrado 


Firma 

Variáveis HBAT A B Cc D E F G H I 

X Qualidade do produto -1,02  —1,28 2,37 1,27 471. -073 -0,83 —1,59 2,99 1,66 
X; Suporte Técnico 1,24 1,69 -0,01 —2,14  —1,76 0,72 1,32 —1,07 0,10 -0,85 
Xo Anúncio 0,02 -013 0,76  -0,01 0,04 -0,73 0,07  -0,60 1,07  -0,20 
X,» Imagem da equipe de venda -1,27 -—1,83 -2,08 3,19 1,53 -0,86 —1,73 407  —1,42 0,97 
X,s Preço competitivo 1,08 0,40 —-1,10 —1,52  —1,48 0,57 0,59 0,65  -0,36 0,53 
X, Garantia e reclamações —1,32 —1,49 1,15  —1,54 0,23 0,81 0,55 —1,80 —1,44 1,39 
Xe. Encomenda e cobrança 0,19 -0,19 -0,30 0,37 0,42 -0,30 -—-0,54 0,08 0,20 0,28 
Xe Velocidade de entrega 0,68 -0,51 -0,95 0,95  —0,27 0,40 0,20 0,86 -—1,15 -0,37 
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TABELA 9-11 Determinação da dimensionalidade adequada em análise de correspondência 
Dimensão Autovalor (Valor singular) Inércia (Qui-quadrado normalizado) Percentual explicado Percentual cumulativo 
1 0,2766066 0,07654 53,1 53,1 
2 0,21866 0,04781 33,2 86,3 
3 0,12366 0,01529 10,6 96,9 
4 0,05155 0,00266 1,8 98,8 
5 0,02838 0,00081 0,6 99,3 
6 0,02400 0,00058 0,4 99,7 
7 0,01951 0,00038 0,3 100,0 


Posicionamento relativo de categorias. A primeira ta- 
refa é avaliar as posições relativas das categorias para as 
linhas e colunas. Fazendo isso, o pesquisador pode avaliar 
a associação entre categorias em termos de suas proximi- 
dades no mapa perceptual. Note que a comparação deve 
ser apenas entre categorias na mesma linha ou coluna. 


O mapa perceptual mostra as proximidades relativas 
de empresas e atributos (ver Figura 9-17). Se nos con- 
centrarmos primeiramente nas empresas, perceberemos 
que o padrão de agrupamentos de firmas é semelhante 
ao encontrado nos resultados MDS. As empresas A, E, 
Fe I, mais a HBAT, formam um grupo; as empresas C 
e D e as firmas H e B formam dois outros grupos pare- 
cidos. No entanto, as proximidades relativas dos mem- 
bros em cada grupo diferem um pouco da solução MDS. 
Além disso, a empresa G é mais isolada e distinta, e as 
empresas F e E agora são vistas como mais parecidas 
com a HBAT. 

Em termos de atributos, surgem diversos padrões. 
Primeiro, X, e X,,, as duas variáveis negativamente re- 
lacionadas, aparecem em extremos opostos do mapa 
perceptual. Além disso, variáveis exibindo elevada as- 
sociação (p.ex., formando fatores) também recaem em 
grande proximidade (X,, e X,; X, e X,). Talvez uma 
perspectiva mais apropriada seja uma contribuição de 
atributo a cada dimensão, como se discute a seguir. 


Interpretação das dimensões. Pode ser útil interpretar 
as dimensões se normalizações de linhas ou colunas são 
usadas. Para esses fins, a inércia (variação explicada) de 
cada dimensão pode ser atribuída entre categorias para 
linhas e colunas. 


A Tabela 9-12 fornece as contribuições de ambos os con- 
juntos de categorias para cada dimensão. Para os atribu- 
tos, podemos ver que X,, (Imagem da Equipe de venda) 
é o principal contribuinte da dimensão I, e X, (Suporte 
Técnico) é um contribuinte secundário. Note que esses 
dois atributos são extremos em termos de suas localiza- 
ções na dimensão I (ou seja, valores mais altos ou mais 
baixos na dimensão 1). Entre esses dois atributos, 86% 


da dimensão I é explicada. Um padrão semelhante se dá 
para a dimensão II, para a qual X, (Qualidade do Pro- 
duto) é o principal contribuinte, seguido por X,, (Preço 
Competitivo), que, quando combinados, explicam 83% 
da inércia da dimensão II. 

Se desviamos nossa atenção para as 10 firmas, perce- 
bemos uma situação um pouco mais equilibrada, em que 
três firmas (A, Ce G) contribuem acima da média de 
10%. Para a segunda dimensão, quatro firmas (B, D, G e 
H) têm contribuições acima da média. 


Apesar de as comparações neste exemplo estarem en- 
tre ambos os conjuntos de categorias e não restritas a um 
só conjunto de categorias (linha ou coluna), essas medidas 
de contribuição demonstram a habilidade para interpretar 
a dimensão quando assim desejado. 


Avaliação de ajuste para categorias. Uma medida 
final fornece uma avaliação de ajuste para cada cate- 
goria. Comparáveis com as cargas fatoriais quadradas 
em análise fatorial (ver Capítulo 3 para uma discussão 
mais detalhada), esses valores representam a quantia de 
variação na categoria explicada pela dimensão. Um va- 
lor total representa a quantia total de variação ao longo 
de todas as dimensões, com o máximo possível sendo 
100%. 


A Tabela 9-12 contém valores de ajuste para cada cate- 
goria em cada dimensão. Como podemos ver, os valores 
de ajuste variam de um valor alto de 99,1 para X, (Qua- 
lidade do Produto) e X,, (Imagem da Equipe de venda) 
a um baixo de 0,372 para X,, (Garantia e Reclamações). 
Entre os atributos, apenas X,, tem um valor abaixo de 
50%, e somente duas empresas (HBAT e 1) ficam abai- 
xo desse valor. Ainda que esses sejam valores um pouco 
baixos, eles ainda representam uma explicação suficien- 
te para retê-los na análise e se considerar a mesma com 
significância prática suficiente. 


Revisão de CA 
Essas e outras comparações destacam as diferenças entre 
os métodos MDS e CA e seus resultados. Os resultados 


530 Análise Multivariada de Dados 


Xe 
1) 
H 
S 
B 
S 
D 
= S& 
(o) 
o C 
õ 4 Xyo 
E Xo (o) 
(a) o 
X16 
o 
Xig 
" E 
X 
X, SF o 18 
O É » 
A mar & 
Xi | 
e SG 
Dimensão | 
Atributos 
E HBAT Xe Qualidade do produto 


<> Firmas concorrentes 


Xa Suporte técnico 

X4o Anúncio 

X4> Imagem da equipe de venda 
X43 Preço competitivo 

X44 Garantia e reclamações 

X4e Encomenda e cobrança 

X4g Velocidade de entrega 


FIGURA 9-17 Mapeamento perceptual com métodos composicionais: análise de correspondência. 


da CA fornecem um meio para comparar diretamente a 
similaridade ou dissimilaridade de empresas e os atributos 
associados, ao passo que o MDS permite apenas a com- 
paração de empresas. Mas a solução CA é condicionada 
ao conjunto de atributos incluídos. Ela assume que todos 
os atributos são apropriados para todas as empresas e 
que a mesma dimensionalidade se aplica a cada empresa. 
Logo, o mapa perceptual resultante sempre deve ser visto 
apenas no contexto das empresas e atributos incluídos na 
análise. 

A análise de correspondência é uma técnica bastan- 
te flexível aplicável a uma vasta gama de questões e si- 
tuações. As vantagens do gráfico conjunto de atributos e 
objetos devem sempre ser ponderadas em relação às in- 
terdependências inerentes que existem e aos efeitos po- 
tencialmente viesados de um atributo ou empresa inade- 
quados, ou talvez mais importante, do atributo omitido 
de uma empresa. Não obstante, a CA ainda fornece uma 
ferramenta poderosa para adquirir visão administrativa 
sobre a posição relativa de empresas e dos atributos asso- 
ciados com tais posições. 


Estágio 6: Validação dos resultados 


Talvez a mais forte validação interna dessa análise seja 
avaliar a convergência entre os resultados de técnicas de- 
composicionais e composicionais separadas. Cada técni- 
ca emprega diferentes tipos de respostas do consumidor, 
mas os mapas perceptuais resultantes são representações 
do mesmo espaço perceptual e devem se corresponder. Se 
a correspondência é alta, o pesquisador pode estar seguro 
de que os resultados refletem o problema como descrito. 
O pesquisador deve observar que esse tipo de convergên- 
cia não trata da generalidade dos resultados para outros 
objetos ou amostras da população. 


A comparação dos métodos decomposicional e compo- 
sicional, mostrados nas Figuras 9-12 e 9-17, pode consi- 
derar duas abordagens: examinar o posicionamento re- 
lativo de objetos e interpretar os eixos. Comecemos pelo 
exame do posicionamento das empresas. Quando as Fi- 
guras 9-12 e 9-17 são rotacionadas para obter-se a mes- 
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TABELA 9-12 | Interpretação das dimensões e sua correspondência com firmas e atributos 


Coordenadas Contribuição para inércia” Explicação por dimensão” 

Objeto I NH HI I [| Total 
Atributo 

X, Qualidade do produto 0,044 1,235 0,001 0,689 0,002 0,989 0,991 
X Suporte Técnico —0,676 —0,285 0,196 0,044 0,789 0,111 0,901 
X, Anúncio —0,081 0,245 0,004 0,045 0,093 0,678 0,772 
X, Imagem da equipe de venda 1,506 0,298 0,665 0,033 0,961 0,030 0,991 
X,3 Preço competitivo —0,202 —0,502 0,018 0,142 0,138 0,677 0,816 
X Garantia e reclamações —0,440 —0,099 0,087 0,006 0,358 0,014 0,372 
X,; Encomenda e cobrança 0,115 0,046 0,007 0,001 0,469 0,058 0,527 
Xe Velocidade de entrega 0,204 —0,245 0,022 0,040 0,289 0,330 0,619 
Firma 

HBAT —0,247 —0,293 0,024 0,042 0,206 0,228 0,433 
A —0,537 —0,271 0,125 0,040 0,772 0,156 0,928 
B —0,444 0,740 0,063 0,224 0,294 0,648 0,942 
C 1,017 0,371 0,299 0,050 0,882 0,093 0,975 
D 0,510 0,556 0,074 0,111 0,445 0,418 0,863 
E —0,237 —0,235 0,025 0,031 0,456 0,356 0,812 
F —0,441 —0,209 0,080 0,023 0,810 0,144 0,954 
G 0,884 —0,511 0,292 0,123 0,762 0,201 0,963 
H —0,206 0,909 0,012 0,289 0,049 0,748 0,797 
| 0,123 —0,367 0,006 0,066 0,055 0,390 0,446 


“Proporção da inércia da dimensão atribuível a cada categoria 
"Proporção de variação de categoria explicada por dimensão 


(Continuação) 
ma perspectiva, elas exibem padrões bem similares de 


empresas que refletem dois grupos: empresas B, H, D e 
Cversus E, F, G e I. Embora as distâncias relativas entre 
empresas variem entre os dois mapas perceptuais, ainda 
vemos a HBAT fortemente associada às empresas A e T 
em cada mapa perceptual. A CA produz maior distinção 
entre as empresas, mas seu objetivo é definir posições de 
empresas como um resultado de diferenças; logo, ela irá 
gerar maior distinção em seus mapas perceptuais. 

A interpretação de eixos e características de distin- 
ção também exibe padrões semelhantes nos dois mapas 
perceptuais. Para o método decomposicional exibido 
na Figura 9-12, notamos na discussão anterior que, pela 
rotação dos eixos, obteríamos uma interpretação mais 
clara. Se rotacionamos os eixos, a dimensão I se torna 
associada com serviço ao cliente e valor do produto (X,, 
X,» X,6€ X,s), ao passo que a dimensão II reflete marke- 
ting e suporte técnico (X,, X, e X,,). Os demais atribu- 
tos não são fortemente associados a qualquer eixo. 

Para fazer uma comparação com análise de cor- 
respondência (Figura 9-17), devemos primeiramente 
reorientar os eixos. Como podemos ver, as dimensões 
mudam entre as duas análises. Os agrupamentos de fir- 
mas permanecem essencialmente os mesmos, mas estão 
em posições diferentes no mapa perceptual. Em CA, as 
dimensões refletem aproximadamente os mesmos ele- 


mentos, com as cargas maiores sendo X,, (Velocidade 
de Entrega) na dimensão I e X,, (Imagem da Equipe de 
venda) na dimensão II. Isso se compara muito favoravel- 
mente com os resultados decomposicionais, exceto pelo 
fato de que os outros atributos estão um pouco mais di- 
fusos nas dimensões. 

No geral, apesar de algumas diferenças de fato existi- 
rem devido às características de cada abordagem, a con- 
vergência dos dois resultados realmente fornece alguma 
validade interna aos mapas perceptuais. Diferenças per- 
ceptuais podem existir para uns poucos atributos, mas 
os padrões gerais de posições de empresas e dimensões 
avaliativas são apoiados por ambas as abordagens. A 
disparidade do atributo de flexibilidade de preço ilustra 
as diferenças dos dois métodos. 


O pesquisador dispõe de duas ferramentas comple- 
mentares na compreensão de percepções de clientes. O 
método decomposicional determina a posição baseado 
em julgamentos gerais, com os atributos aplicados somen- 
te como uma tentativa para explicar as posições. O mé- 
todo composicional posiciona empresas de acordo com o 
conjunto selecionado de atributos, criando assim posições 
baseadas nos atributos. Além disso, cada atributo é igual- 
mente ponderado, de modo que há potenciais distorções 
do mapa com atributos irrelevantes. Essas diferenças não 
tornam qualquer técnica melhor ou ótima, mas, em vez 


532 Análise Multivariada de Dados 


disso, devem ser compreendidas pelo pesquisador para 
garantir a seleção do método mais adequado aos objeti- 
vos de pesquisa. 


Uma visão gerencial dos resultados do MDS 


O mapeamento perceptual é uma técnica ímpar que for- 
nece comparações gerais que não são prontamente possí- 
veis com qualquer outro método multivariado. Como tal, 
seus resultados oferecem várias perspectivas para uso ad- 
ministrativo. A aplicação mais comum dos mapas percep- 
tuais é para a avaliação de imagem para qualquer empre- 
sa ou grupo de empresas. Enquanto variável estratégica, a 
imagem pode ser importante como um indicador geral de 
presença ou posição no mercado. 


Neste estudo, descobrimos que a HBAT está mais pro- 
ximamente associada às empresas A e I e mais distante 
das empresas C, E e G. Assim, quando servem os mes- 
mos mercados, a HBAT pode identificar as empresas 
consideradas semelhantes ou distintas de sua imagem. 
Com os resultados baseados não em qualquer conjun- 
to de atributos específicos, mas em julgamentos gerais 
de respondentes, as imagens apresentam o benefício de 
não estarem sujeitas a julgamentos subjetivos de um 
pesquisador, como atributos a serem incluídos ou a for- 
ma de ponderar os atributos individuais, mantendo o 
verdadeiro espírito de avaliação de imagem. No entan- 
to, as tecnologias MDS são menos úteis para guiar es- 
tratégias por serem menos úteis para prescrever como 
mudar a imagem. As respostas globais que são vantajo- 
sas para a comparação agora funcionam contra nós na 
explicação. 


Apesar de as técnicas MDS poderem aumentar a ex- 
plicação dos mapas perceptuais, elas devem ser vistas 
como suplementares e provavelmente com maiores incon- 
sistências do que se fossem integradas ao processo. Logo, 
uma pesquisa adicional pode ajudar a explicar as posições 
relativas. 

Para este fim, os resultados da CA são uma abordagem 
conciliadora, na tentativa de retratar mapas perceptuais 
sob uma perspectiva composicional. A comparação de re- 
sultados da CA com os da solução MDS clássica revela di- 
versas consistências, mas também algumas discrepâncias. 


A comparação das duas soluções identifica alguns 
padrões gerais de associações entre firmas (como A 
HBAT e as firmas A e 1) e entre grupos de atributos. A 
administração da HBAT pode usar tais resultados não 
apenas como um guia para a política geral, mas tam- 
bém como referencial para futura investigação com ou- 
tras técnicas multivariadas sobre questões de pesquisa 
mais específicas. 


O pesquisador deve observar que nenhuma técnica 
tem a resposta absoluta, mas que cada uma pode ser usada 
para capitalizar sobre seus benefícios relativos. Quando 
empregadas dessa maneira, as diferenças esperadas nas 
duas técnicas podem, realmente, fornecer visões únicas e 
complementares sobre a questão de pesquisa. 


Resumo 


Escalonamento multidimensional é um conjunto de pro- 
cedimentos que pode ser usado para representar grafica- 
mente as relações descobertas por dados que representam 
similaridade ou preferência. Essa técnica tem sido usada 
com sucesso (1) para ilustrar segmentos de mercado com 
base em julgamentos de preferência, (2) para determi- 
nar quais produtos são mais competitivos entre si (isto 
é, são mais similares), e (3) para deduzir quais critérios 
as pessoas usam quando julgam objetos (p.ex., produtos, 
companhias, anúncios). Este capítulo ajuda você a fazer 
o seguinte: 


Definir escalonamento multidimensional e descrever 
como ele é executado. Escalonamento multidimensional 
(MDS), também conhecido como mapeamento perceptu- 
al, é um procedimento que permite que um pesquisador 
determine a imagem relativa percebida de um conjunto 
de objetos (firmas, produtos, idéias ou outros itens asso- 
ciados com percepções comumente mantidas). O propósi- 
to do MDS é transformar julgamentos de clientes, quanto 
a similaridade ou preferência geral (p.ex., preferência por 
lojas ou marcas), em distâncias representadas em um es- 
paço multidimensional. Para executar uma análise de es- 
calonamento multidimensional, o pesquisador realiza três 
passos básicos: (1) reúne medidas de similaridade ou de 
preferência no conjunto inteiro de objetos a serem ana- 
lisados, (2) usa técnicas MDS para estimar a posição re- 
lativa de cada objeto no espaço multidimensional, e (3) 
identifica e interpreta os eixos do espaço dimensional em 
termos de atributos perceptuais e/ou objetivos. O mapa 
perceptual, também chamado de mapa espacial, exibe o 
posicionamento relativo de todos os objetos. 


Entender as diferenças entre dados de similaridade e de 
preferência. Depois de escolher objetos para o estudo, 
o pesquisador deve a seguir escolher a base de avaliação: 
similaridade ou preferência. Ao fornecerem dados de si- 
milaridade, os respondentes não aplicam quaisquer aspec- 
tos do tipo “bom-ruim” de avaliação na comparação, mas 
com dados de preferência avaliações desse tipo são feitas. 
Em resumo, dados de preferência assumem que diferentes 
combinações de atributos percebidos são melhor valora- 
das do que outras. Ambas as bases de comparação podem 
ser usadas para desenvolver mapas perceptuais, mas com 
diferentes interpretações: (1) mapas perceptuais baseados 
em similaridade representam semelhanças de atributos e 
dimensões perceptuais de comparação, mas não refletem 
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qualquer visão direta sobre os determinantes de escolha; e 
(2) mapas perceptuais baseados em preferências refletem 
escolhas preferidas, mas podem não corresponder de for- 
ma alguma às posições baseadas em semelhança, pois res- 
pondentes podem sustentar suas escolhas sobre dimensões 
ou critérios inteiramente diferentes daqueles nos quais 
eles baseiam comparações. Sem qualquer base ótima para 
avaliação, a decisão entre dados de similaridades e de pre- 
ferência deve ser feita com a mais importante questão de 
pesquisa em mente, pois eles são fundamentalmente dis- 
tintos em termos do que representam. 


Selecionar entre uma abordagem decomposicional e uma 
composicional. Técnicas de mapeamento perceptual po- 
dem ser classificadas em um entre dois tipos, com base na 
natureza das respostas obtidas a partir de indivíduos, refe- 
rentes a objetos: (1) o método decomposicional, que mede 
somente a impressão ou avaliação geral de um objeto e 
então tenta derivar posições espaciais em espaço multi- 
dimensional que reflitam essas percepções (ele emprega 
dados de similaridade ou de preferência e é a abordagem 
tipicamente associada ao MDS), e (2) o método compo- 
sicional, que emprega diversas técnicas multivariadas já 
discutidas que são usadas para formar uma impressão ou 
avaliação com base em uma combinação de atributos es- 
pecíficos. Mapeamentos perceptuais podem ser realizados 
com técnicas tanto decomposicionais quanto composicio- 
nais, mas cada técnica apresenta vantagens e desvantagens 
específicas que devem ser consideradas do ponto de vista 
dos objetivos da pesquisa. Se o mapeamento perceptual é 
levado a cabo como técnica exploratória para identificar 
dimensões não-reconhecidas ou como meio de se obter 
avaliações comparativas de objetos quando as bases espe- 
cíficas de comparação são desconhecidas ou não-definidas, 
as abordagens decomposicionais (livres de atributos) são 
as mais adequadas. Em contrapartida, se as metas da pes- 
quisa incluem a representação gráfica entre objetos em um 
conjunto definido de atributos, então as técnicas composi- 
cionais são a alternativa preferível. 


Determinar a comparabilidade e o número de obje- 
tos. Antes de se executar qualquer estudo de mapea- 
mento perceptual, o pesquisador deve tratar de duas 
questões-chave em relação aos objetos sendo avaliados. 
Essas questões lidam com a garantia de comparabilida- 
de dos objetos e com a seleção do número de objetos a 
serem avaliados. A primeira questão ao se selecionar ob- 
jetos é: eles são realmente comparáveis? Uma suposição 
implícita em mapeamento perceptual é aquela sobre ca- 
racterísticas em comum, sejam objetivas ou percebidas, 
usadas pelo respondente no processo de avaliação. Logo, 
é essencial que os objetos sob comparação tenham um 
conjunto de atributos inerentes que caracterizam cada 
um deles e formam a base de comparação feita pelo 
respondente. Não é possível que o pesquisador force o 
respondente a fazer comparações criando pares de ob- 


jetos não comparáveis. Uma segunda questão se refere 
ao número de objetos a serem avaliados. Ao se decidir 
quantos objetos devem ser incluídos, o pesquisador deve 
equilibrar dois desejos: por um número menor de objetos 
para facilitar o esforço por parte do respondente, e por 
uma quantia exigida de objetos para se obter uma solu- 
ção multidimensional estável. Geralmente deve ser feita 
uma negociação entre o número de dimensões inerentes 
que podem ser identificadas e o esforço exigido por parte 
do respondente para avaliá-las. 


Entender como criar um mapa perceptual. Três passos 
estão envolvidos na criação de um mapa perceptual com 
base nas posições ótimas dos objetos. O primeiro é esco- 
lher uma configuração inicial de estímulos em uma dimen- 
sionalidade inicial desejada. As duas abordagens mais 
amplamente utilizadas para obter a configuração inicial 
são aquela que se sustenta em dados prévios e aquela que 
gera uma através da seleção de pontos pseudo-aleatórios a 
partir de uma distribuição multivariada aproximadamente 
normal. O segundo passo é computar as distâncias entre 
os pontos de estímulos e comparar as relações (observa- 
das versus derivadas) com uma medida de ajuste. Uma 
vez que a configuração é encontrada, as distâncias entre 
estímulos nas configurações iniciais são comparadas com 
as medidas de distância obtidas a partir de julgamentos 
de similaridade. As duas medidas de distância são então 
comparadas por uma medida de ajuste, geralmente sendo 
uma medida de desajuste. O terceiro passo é necessário 
se a medida de ajuste não alcançar um valor de parada 
previamente escolhido. Em tais casos, você encontra uma 
nova configuração para a qual a medida de ajuste é mini- 
mizada. O programa de computador determina as dire- 
ções nas quais o melhor ajuste pode ser obtido e então 
move os pontos na configuração naquelas direções em pe- 
quenos incrementos. 


Explicar análise de correspondência como um método 
de mapeamento perceptual. Análise de correspondên- 
cia (CA) é uma técnica de interdependência que tem se 
tornado cada vez mais popular para redução dimensional 
e mapeamento perceptual. A análise de correspondên- 
cia tem três características marcantes: (1) é uma técnica 
composicional, e não decomposicional, porque o mapa 
perceptual se baseia na associação entre objetos e um 
conjunto de características ou atributos descritivos espe- 
cificados pelo pesquisador; (2) é a aplicação mais direta na 
representação gráfica da correspondência de categorias 
de variáveis, particularmente aquelas medidas em escalas 
nominais, que é então usada como a base para o desen- 
volvimento de mapas perceptuais; e (3) os benefícios ex- 
clusivos da CA repousam em suas habilidades para repre- 
sentar linhas e colunas, por exemplo, marcas e atributos, 
em um espaço conjunto. Resumidamente, a análise de 
correspondência oferece uma valiosa ferramenta analítica 
para um tipo de dado (não-métrico) que frequentemente 
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não é o ponto focal de técnicas multivariadas. A análise 
de correspondência também oferece ao pesquisador uma 
técnica composicional complementar a MDS para tratar 
de questões nas quais a comparação direta de objetos e 
atributos é preferível. 

O MDS pode revelar relações que parecem estar obs- 
curas quando se examinam somente os números resultan- 
tes de um estudo. Um mapa perceptual com apelo visual 
enfatiza as relações entre os estímulos sob estudo. Deve- 
mos tomar muito cuidado quando utilizamos essa técnica. 
O seu uso de forma incorreta é comum. O pesquisador 
deve se familiarizar com o método antes de usá-lo e ver os 
resultados apenas como o primeiro passo para a determi- 
nação de informações perceptuais. 


Questões 


1. Como o MDS difere de outras técnicas de interdependência 
(análise de agrupamentos e análise fatorial)? 

2. Qual é a diferença entre dados de preferência e dados de 
similaridade, e que impacto eles têm sobre os resultados de 
procedimentos MDS? 

3. Como os pontos ideais são empregados em procedimentos 
MDS? 

4. Quais são as diferenças entre procedimentos MDS métricos 
e não-métricos? 

5. Como o pesquisador pode determinar quando a solução 
MDS ótima foi obtida? 

6. Como o pesquisador identifica as dimensões em MDS? 
Compare esse método com o procedimento para a análise 
fatorial. 

7. Compare e contraste as técnicas CA e MDS. 

8. Descreva como é obtida correspondência ou associação a 
partir de uma tabela de contingência. 

9. Descreva os métodos para interpretação de categorias (li- 
nha ou coluna) em CA. As categorias sempre podem ser di- 
retamente comparadas com base em proximidade no mapa 
perceptual? 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustram problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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SEÇÃO 


Para Além das Técnicas Básicas 


VISÃO GERAL 


Esta seção oferece uma introdução simples e concisa a algu- 
mas das técnicas de vanguarda que estão agora emergindo 
na análise multivariada. Muito frequentemente a adoção de 
uma nova técnica é retardada pela mistificação de especialis- 
tas que não passam ou não podem passar seu conhecimento 
para outros. Além disso, os pesquisadores de hoje estão dian- 
te de diversas técnicas novas e animadoras que se proliferam 
mais do que nunca e que podem estender suas capacidades 
para lidar com problemas que eram difíceis ou até impossíveis 
de resolver antes. Assim, esta seção oferece uma introdução 
estendida de algumas dessas técnicas para fornecer ao lei- 
tor uma compreensão geral dos procedimentos, o conheci- 
mento de quando elas podem ser aplicadas, e um conheci- 
mento de seu funcionamento que deve viabilizar ao usuário a 
aplicação dessas técnicas em problemas básicos. De forma 
alguma seremos capazes de cobrir tudo o que há de novo 
em análise multivariada. Selecionamos, então, um importante 
avanço para se lidar com múltiplas relações de dependência 
(modelagem de equações estruturais). Ela representa a técni- 
ca multivariada que mais tem crescido em popularidade nos 
últimos 20 anos. 


CAPÍTULOS NA SEÇÃO IV 


A Seção IV contém três capítulos. O Capítulo 10 fornece uma 
visão geral da modelagem de equações estruturais (SEM), um 
procedimento para acomodar erro de mensuração (ou erro de 
medida) diretamente na estimação de uma série de relações 
de dependência. É o melhor procedimento multivariado para 
testar a validade de construto e as relações teóricas entre 
conceitos representados por múltiplas variáveis medidas. 
Antes da introdução da SEM, este processo iria requerer a 
aplicação de diversas ferramentas estatísticas e o resultado 


seria um exame menos satisfatório. A modelagem de equa- 
ções estruturais tem sido amplamente aceita na comunidade 
acadêmica, mas tem conquistado pouco uso em outras áreas 
devido, em parte, à curva de aprendizagem percebida asso- 
ciada com tal método. Não queremos subestimar os esforços 
envolvidos, mas nenhum pesquisador deveria evitar a SEM 
apenas por esse motivo, pois os princípios da análise fatorial 
e da regressão múltipla formam a fundamentação para a com- 
preensão da SEM. 

Seguindo a visão geral básica, o Capítulo 11 é devotado 
à análise fatorial confirmatória, a qual estende as idéias ante- 
riormente apresentadas quando discutimos a análise fatorial 
exploratória. Agora, porém, o pesquisador deve desempenhar 
um papel mais ativo ao desenvolver e especificar uma teoria 
que determinará quantos fatores devem existir em um conjun- 
to de variáveis e como elas se relacionam ou se apresentam 
em termos de cargas sobre um número menor de fatores. É 
fornecido um teste sobre o quão bem esta teoria se ajusta aos 
dados que permite ao leitor examinar diretamente a validade 
de construto neste conjunto de medidas. 

O Capítulo 12 é dedicado ao teste de relações teóricas en- 
tre os fatores representados por múltiplas variáveis. O objetivo 
aqui é testar a estrutura de relações entre os fatores. Portanto, 
é conceitualmente semelhante à condução de análise de re- 
gressão usando-se um conjunto de escalas múltiplas de ava- 
liação, sendo que cada uma delas representa um fator que 
pode ser recuperado com análise fatorial. Usando SEM, o pes- 
quisador pode avaliar a força de relações entre dois fatores 
quaisquer com maior precisão, pois a SEM corrige a relação 
quanto a erro de medida. Além disso, um teste geral de ajuste 
é fornecido para viabilizar ao pesquisador uma avaliação da 
validade de um conjunto pré-especificado de hipóteses, com 
cada uma delas representando uma relação de regressão en- 
tre fatores. Uma vez que o Capítulo 11 permite um exame di- 
reto da validade de uma teoria de mensuração, o Capítulo 12 
descreve técnicas que culminam em um exame detalhado da 
teoria estrutural que descreve como fatores-chave de resulta- 
dos são afetados por outros fatores-chave de entrada. 


CAPÍTULO 


Modelagem de Equações Estruturais: 
Uma Introdução 


Objetivos de aprendizagem 
Ao concluir este capítulo, você deverá ser capaz de: 


Entender as características distintivas da SEM. 
Diferenciar variáveis de construtos. 
Entender a modelagem de equações estruturais e como ela pode ser vista como uma 
combinação de técnicas multivariadas conhecidas. 

m Conhecer as condições básicas para causalidade e como SEM pode ajudar a estabelecer 
uma relação de causa e efeito. 
Explicar os tipos de relações envolvidas na SEM. 
Entender que o objetivo da SEM é explicar covariância e como isso se traduz no ajuste de um 
modelo. 
Saber como representar visualmente um modelo SEM com um diagrama de caminhos. 
Listar os seis estágios de modelagem de equações estruturais e compreender o papel da 
teoria no processo. 


Apresentação do capítulo 


Um dos principais objetivos de técnicas multivariadas é expandir a habilidade explanatória do pesqui- 
sador e a eficiência estatística. Regressão múltipla, análise fatorial, análise multivariada de variância, 
análise discriminante e as outras técnicas discutidas em capítulos anteriores fornecem ao pesquisador 
ferramentas poderosas para resolver uma vasta gama de questões administrativas e teóricas. Todas 
elas também compartilham de uma limitação em comum: cada técnica pode examinar somente uma 
relação por vez. Mesmo as técnicas que permitem múltiplas variáveis dependentes, como a análise 
multivariada de variância e a análise canônica, ainda representam apenas uma relação entre as variá- 
veis dependentes e independentes. 

Muito comumente, porém, o pesquisador se defronta com um conjunto de questões inter-relaciona- 
das. Por exemplo, quais variáveis determinam a imagem de uma loja? Como essa imagem se combina 
com outras variáveis para afetar decisões de compra e satisfação com a loja? Como satisfação com 
a loja resulta em lealdade a longo prazo com a mesma? Essa série de questões tem importância ad- 
ministrativa e teórica. No entanto, nenhuma das técnicas multivariadas que examinamos nos permite 
tratar de todas essas questões com um só método abrangente. Em outras palavras, esses métodos não 
nos permitem testar a teoria inteira do pesquisador com uma técnica que considere toda a informação 
possível. Por essa razão, examinamos agora a técnica de modelagem de equações estruturais (SEM), 
uma extensão de diversas técnicas multivariadas que já estudamos, mais precisamente da regressão 
múltipla e da análise fatorial. 

Como brevemente descrito no Capítulo 1, a modelagem de equações estruturais pode examinar 
uma série de relações de dependência simultaneamente. Ela é particularmente útil para testar teorias 
que contêm múltiplas equações envolvendo relações de dependência. Em outras palavras, se acredi- 
tamos que uma imagem cria satisfação, e satisfação cria lealdade, então satisfação é uma variável de- 
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pendente e independente na mesma teoria. Assim, uma variável presumivelmente dependente se torna 
independente em uma relação subsequente de dependência. Nenhuma dessas técnicas anteriores nos 
permite avaliar ambas as propriedades de medida e testar as relações teóricas importantes em uma só 
abordagem. A SEM ajuda a tratar desses tipos de questões. 


Termos-chave 


Antes de começar o capítulo, leia os termos-chave para com- 
preender os conceitos e a terminologia empregados. Ao longo 
do capítulo, os termos-chave aparecem em negrito. Outros 
pontos que merecem destaque, além das referências cruza- 
das nos termos-chave, estão em itálico. Exemplos ilustrativos 
estão em quadros. 


Abordagem baseada em modelos Método de substituição 
para dados perdidos no qual valores são estimados para 
dados perdidos com base em todos os dados não-perdidos 
para um dado respondente. Os métodos mais usados são a 
estimação de máxima verossimilhança (ML) de valores perdi- 
dos e EM, que envolve estimação de máxima verossimilhança 
das médias e covariâncias, tendo-se os dados perdidos. 

Abordagem de caso completo Método para lidar com dados 
perdidos que computa valores com base em dados de so- 
mente casos completos, ou seja, casos sem dados perdidos. 
Também conhecido como eliminação listwise. 

Abordagem de disponibilidade Método para lidar com dados 
perdidos que computa valores com base em todas as obser- 
vações válidas disponíveis. Também conhecido como elimi- 
nação aos pares. 

Ajuste Ver qualidade de ajuste. 

Análise confirmatória Uso de uma técnica multivariada para 
testar (confirmar) uma relação pré-especificada. Por exemplo, 
suponha que teorizemos que apenas duas variáveis deveriam 
ser preditoras de uma variável dependente. Se testarmos 
empiricamente a significância desses dois preditores e a não 
significância de todos os outros, esse teste será uma análise 
confirmatória. É o oposto de análise exploratória. 

Análise de caminhos Termo geral para um método que empre- 
ga correlações bivariadas simples para estimar as relações 
em um modelo SEM. A análise de caminhos busca determinar 
os pontos fortes dos caminhos mostrados em diagramas de 
caminhos. 

Análise exploratória Análise que define possíveis relações 
apenas na forma mais geral e então permite que a técnica 
multivariada estime relações. O oposto da análise confirma- 
tória, o pesquisador não busca confirmar quaisquer relações 
especificadas anteriormente à análise, mas, ao invés disso, 
deixa o método e os dados definirem a natureza das relações. 
Um exemplo é a regressão múltipla stepwise, na qual o méto- 
do acrescenta variáveis preditoras até que algum critério seja 
satisfeito. 

Atribuição Processo de estimação dos dados perdidos de uma 
observação baseado em valores válidos das outras variáveis. 
O objetivo é empregar relações conhecidas que possam ser 
identificadas nos valores válidos da amostra para auxiliar na 
representação ou mesmo na estimação das substituições 


para valores perdidos. Ver também abordagem totalmente 
disponível, de caso completo, e baseada em modelo para 
dados perdidos. 

Causalidade Princípio pelo qual causa e efeito são estabeleci- 
dos entre duas variáveis. Ele requer que exista um grau sufi- 
ciente de associação (covariância) entre as duas variáveis, 
que uma variável ocorra antes da outra (que uma variável seja 
claramente o resultado da outra), e que não existam outras 
causas razoáveis para o resultado. Apesar de causalidade 
ser raramente encontrada em seu sentido estrito, na prática, 
forte apoio teórico pode tornar possível a estimação empírica 
de causalidade. 

Completamente perdidos ao acaso (MCAR) Classificação de 
dados perdidos aplicável quando valores perdidos de Y não 
dependem de X. Quando os dados perdidos são MCAR, os 
valores observados de Y são uma amostra verdadeiramente 
aleatória de todos os valores de Y, sem um processo inerente 
que acrescente viés aos dados observados. 

Comunalidade Quantia total de variância que uma variável me- 
dida tem em comum com os construtos sobre os quais ela 
tem carga. A prática da boa medição sugere que cada variá- 
vel medida deve carregar sobre apenas um construto. Logo, 
ela pode ser imaginada como a variância explicada em uma 
variável medida pelo construto. Em CFA, ela é chamada de 
correlação múltipla quadrada para uma variável medida. Ver 
também variância extraída no próximo capítulo. 

Confiabilidade Medida do grau em que um conjunto de indica- 
dores de um construto latente é internamente consistente em 
suas mensurações. Os indicadores de construtos altamente 
confiáveis são altamente intercorrelacionados, indicando que 
eles todos parecem medir a mesma coisa. A confiabilidade 
de item individual pode ser computada como 1,0 menos o 
erro de mensuração. Note que elevada confiabilidade não 
garante que um construto está representando aquilo que de- 
veria. É uma condição necessária, porém não suficiente para 
validade. 

Construto Conceito inobservável ou latente que o pesquisador 
pode definir em termos teóricos mas que não pode ser di- 
retamente medido (p.ex., o respondente não pode articular 
uma única resposta que fornecerá total e perfeitamente uma 
medida do conceito) ou medido sem erro (ver erro de men- 
suração). Um construto pode ser definido em diversos graus 
de especificidade, variando de conceitos muito limitados até 
aqueles mais complexos ou abstratos, como inteligência ou 
emoções. Não importa qual o seu nível de especificidade, po- 
rém, um construto não pode ser medido direta e perfeitamen- 
te, mas deve ser medido aproximadamente por indicadores 
múltiplos. 

Construto latente Operacionalização de um construto em 
modelagem de equações estruturais. Um construto latente 
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Construtos endógenos Latente, equivalente multi-item a variá- 


não pode ser diretamente medido, mas pode ser represen- 
tado ou medido por uma ou mais variáveis (indicadores). Por 
exemplo, a atitude de uma pessoa em relação a um produto 
jamais pode ser medida precisamente a ponto de não haver 
incerteza, mas fazendo-se várias perguntas podemos avaliar 
muitos aspectos da atitude dessa pessoa. Em combinação, 
as respostas a tais questões fornecem uma medida razoa- 
velmente precisa do construto latente (atitude) para um in- 
divíduo. 


veis dependentes. Um construto endógeno é representado 
por uma variável estatística de variáveis dependentes. Em 
termos de um diagrama de caminhos, uma ou mais setas (in- 
dicações) conduzem até o construto endógeno. 


Construtos exógenos [Latente, equivalente multi-item de va- 


riáveis independentes. Eles são construtos determinados por 
fatores fora do modelo. 


Diagrama de caminhos Representação visual de um modelo e 


do conjunto completo de relações entre os construtos do mo- 
delo. Relações de dependência são representadas por setas 
retilíneas, apontando da variável preditora para a variável ou 
construto dependente. Setas curvas correspondem a correla- 
ções entre construtos ou indicadores, mas nenhuma causali- 
dade é implicada. 


Erro de mensuração Grau em que as variáveis que pode- 


mos medir não descrevem perfeitamente o(s) construto(s) 
latente(s) de interesse. Fontes de erro de mensuração podem 
variar de simples erros de entrada de dados a definição de 
construtos (p.ex., conceitos abstratos como patriotismo ou le- 
aldade, que significam muitas coisas para diferentes pessoas) 
que não são perfeitamente caracterizados por um conjunto 
de variáveis medidas. Para fins práticos, todos os construtos 
têm algum erro de mensuração, mesmo com as melhores va- 
riáveis indicadoras. No entanto, o objetivo do pesquisador é 
minimizar a quantia de erro de mensuração. SEM pode levar 
em conta erro de mensuração a fim de fornecer estimativas 
mais precisas das relações entre construtos. 


Estatística de diferença (Ax”) de qui-quadrado (x) Mode- 


los SEM concorrentes aninhados podem ser comparados 
usando-se esta estatística, que é a diferença simples entre 
as estatísticas (x) de cada modelo e tem número de graus 
de liberdade igual à diferença nos graus de liberdade dos 
modelos. 


Estimação de máxima verossimilhança (MLE) Método de es- 


timação comumente empregado em modelos de equações 
estruturais. Uma alternativa aos usuais mínimos quadrados 
usados em regressão múltipla, MLE é um procedimento que 
melhora por iterações as estimativas de parâmetros para mi- 
nimizar uma função de ajuste especificada. 


Estratégia de desenvolvimento de modelo Estratégia de mo- 


delagem estrutural que incorpora reespecificação de modelo 
como um método teoricamente orientado de melhoria de um 
modelo especificado empiricamente. Isso permite explora- 
ção de formulações alternativas de modelos que podem ser 
apoiadas por teoria. Uma estrutura básica de modelo é pro- 
posta, e a meta do esforço de modelagem é melhorar esta 


estrutura através de modificações dos modelos estrutural e/ 
ou de mensuração. O modelo modificado seria validado com 
novos dados. Não corresponde a uma abordagem explo- 
ratória na qual reespecificações de modelo são feitas sem 
base teórica. 


Estratégia de modelagem confirmatória Estratégia que avalia 


estatisticamente um único modelo quanto ao seu ajuste aos 
dados observados. Essa abordagem é realmente menos ri- 
gorosa do que a estratégia de modelos concorrentes, pois ela 
não considera modelos alternativos que possam se ajustar 
melhor ou tão bem como o modelo proposto. 


Estratégia de modelos concorrentes Estratégia de modela- 


gem que compara o modelo proposto com vários modelos 
alternativos em uma tentativa de demonstrar que não existe 
modelo de melhor ajuste. Isso é particularmente relevante em 
modelagem de equações estruturais porque um modelo pode 
ter ajuste apenas aceitável, mas ajuste somente aceitável não 
garante que um outro modelo não se ajustará de melhor forma 
ou tão bem quanto. 


Fator latente Ver construto latente. 
Graus de liberdade (df) O número de bits de informação dispo- 


nível para estimar a distribuição amostral dos dados depois 
que todos os parâmetros do modelo tenham sido estimados. 
Em modelos SEM, graus de liberdade são o número de corre- 
lações ou covariâncias não redundantes na matriz de entrada 
menos o número de coeficientes estimados. O pesquisador 
tenta maximizar os graus de liberdade disponíveis enquanto 
ainda obtém o modelo de melhor ajuste. Cada coeficiente es- 
timado “consome completamente” um grau de liberdade. Um 
modelo jamais pode estimar mais coeficientes do que o nú- 
mero de correlações ou covariâncias não redundantes, o que 
significa que zero é o limite inferior para os graus de liberdade 
de qualquer modelo. 


Indicador Valor observado (também chamado de variável me- 


dida ou manifesta) usado como uma medida de um construto 
latente que não pode ser medido diretamente. O pesquisador 
deve especificar quais indicadores são associados com cada 
construto latente. 


Índices de ajuste de parcimônia Medidas de qualidade de 


ajuste geral representando o grau de ajuste de modelo por 
coeficiente estimado. Esta medida tenta corrigir qualquer 
superajuste do modelo e avalia a proporção de parcimô- 
nia do modelo em comparação com a qualidade de ajuste. 
Essas medidas complementam os outros dois tipos de me- 
didas de qualidade de ajuste, o ajuste absoluto e o ajuste 
incremental. 


Índices de ajuste incremental Grupo de índices de qualidade 


do ajuste que avaliam o quão bem um modelo especificado 
se ajusta relativamente a algum modelo de referência alterna- 
tivo. Mais comumente, o modelo de referência é um modelo 
nulo especificando que todas as variáveis medidas são não 
relacionadas entre si. Complementa os outros dois tipos de 
medidas de qualidade de ajuste, as de ajuste absoluto e de 
ajuste parcimonioso. 


Inferência causal Relação de dependência de duas ou mais 


variáveis na qual o pesquisador claramente especifica que 
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uma ou mais variáveis causam ou criam um resultado repre- 
sentado por pelo menos uma outra variável. Deve atender às 
exigências de causalidade. 

LISREL O programa SEM mais amplamente usado. O nome é 
derivado de Llnear Structural RELations (relações estruturais 
lineares). 

Matriz de covariância amostral observada Matriz típica de en- 
trada para estimação de SEM composta das variâncias e co- 
variâncias observadas para cada variável medida. É normal- 
mente abreviada com uma letra S maiúscula em negrito (S) 

Matriz de covariância estimada Matriz de covariância com- 
posta das covariâncias previstas entre todas as variáveis in- 
dicadoras envolvidas em uma SEM baseada nas equações 
que representam o modelo teorizado. Tipicamente abreviada 
como B,. 

Medida de ajuste absoluto Medida de qualidade de ajuste ge- 
ral para os modelos estrutural e de mensuração coletivamen- 
te. Esse tipo de medida não faz qualquer comparação com 
um modelo nulo especificado (medida de ajuste incremental) 
ou ajuste para o número de parâmetros no modelo estimado 
(medida de ajuste parcimonioso). 

Modelagem de equações estruturais (SEM) Técnica multi- 
variada que combina aspectos de análise fatorial e de re- 
gressão múltipla que permite ao pesquisador examinar 
simultaneamente uma série de relações de dependência 
inter-relacionadas entre as variáveis medidas e construtos 
latentes (variáveis estatísticas), bem como entre diversos 
construtos latentes. 

Modelo Representação e operacionalização de uma teoria. Um 
modelo convencional em terminologia SEM consiste de duas 
partes. A primeira parte é o modelo de mensuração. Ele re- 
presenta a teoria que mostra como variáveis medidas se jun- 
tam para representar construtos. A segunda parte é o modelo 
estrutural, que mostra como os construtos são associados 
uns com os outros, geralmente com múltiplas relações de de- 
pendência. O modelo pode ser formalizado em um diagrama 
de caminhos. 

Modelo aninhado Um modelo é aninhado dentro de outro se 
tem o mesmo número de construtos e pode ser formado a 
partir de outro modelo alterando-se as relações. A forma mais 
comum de modelo aninhado ocorre quando uma única rela- 
ção é acrescentada ou eliminada de um outro modelo. Logo, 
o modelo com menos relações estimadas está aninhado den- 
tro do modelo mais geral. 

Modelo de mensuração Uma SEM que (1) especifica os indica- 
dores para cada construto, e (2) viabiliza a avaliação de va- 
lidade de construto. É o primeiro de dois passos importantes 
em uma análise completa de modelo estrutural, e é discutido 
com mais detalhes no Capítulo 11. 

Modelo estrutural Conjunto de uma ou mais relações de de- 
pendência conectando os construtos hipoteticamente previs- 
tos do modelo. O modelo estrutural é mais útil para represen- 
tar as inter-relações de variáveis entre construtos. 

Modelo nulo Ponto de referência ou padrão de comparação 
usado em índices de ajuste incremental. O modelo nulo é con- 


siderado, por hipótese, como o mais simples que pode ser 
teoricamente justificado. 

Modelos equivalentes Modelos SEM envolvendo a mesma 
matriz de covariância observada com o mesmo ajuste e com 
o mesmo número de graus de liberdade (modelos aninha- 
dos), mas que diferem em um ou mais caminhos. O número 
de modelos equivalentes se expande rapidamente conforme 
a complexidade do modelo aumenta, e demonstra explica- 
ções alternativas que se ajustam tão bem quanto o modelo 
proposto. 

Multicolinearidade Extensão em que um construto pode ser 
explicado pelos demais na análise. Quando a multicolineari- 
dade aumenta, ela complica a interpretação de relações, pois 
é mais difícil averiguar o efeito de qualquer construto em es- 
pecial devido a suas inter-relações. 

Operacionalização de um construto Processo-chave no mo- 
delo de mensuração que envolve a determinação das variá- 
veis medidas que representarão um construto e a maneira na 
qual elas serão medidas. 

Parâmetro fixado Parâmetro que tem um valor especificado 
pelo pesquisador. Geralmente o valor é especificado como 
zero, indicando ausência de relação, apesar de que em al- 
guns casos um valor não nulo (como 1,0 ou algo assim) pode 
ser especificado. 

Parâmetro livre Parâmetro estimado pelo programa de equa- 
ção estrutural para representar a força de uma relação es- 
pecificada. Esses parâmetros podem ocorrer no modelo de 
mensuração (mais frequentemente denotando cargas de in- 
dicadores para construtos) bem como no modelo estrutural 
(relações entre construtos). 

Perdidos ao acaso (MAR) Classificação de dados perdidos 
aplicável quando valores perdidos de Y dependem de X, 
mas não de Y. Quando dados perdidos são MAR, dados 
observados para Y são uma amostra verdadeiramente alea- 
tória para os valores de X na amostra, mas não uma amostra 
aleatória de todos os valores de Y devido a valores perdidos 
de X. 

Proporção de parcimônia Comparação dos graus de liberdade 
(af) entre um modelo especificado e o número total de graus 
de liberdade disponíveis. Representa a extensão em que o 
modelo utiliza o número total de graus de liberdade dispontí- 
vel. Permite a avaliação do superajuste do modelo com rela- 
ções adicionais que conquistam apenas pequenos ganhos no 
ajuste do modelo. 

Qualidade de ajuste (GOF) Medida indicando o quão bem um 
modelo especificado reproduz a matriz de covariância entre 
as variáveis indicadoras. 

Qualidade de desajuste Uma perspectiva alternativa de qua- 
lidade de ajuste na qual valores maiores representam ajuste 
pior. Exemplos incluem a raiz do erro quadrático médio de 
aproximação ou a raiz padronizada do resíduo quadrático 
médio. 

Qui-quadrado (x) Medida estatística de diferença usada para 
comparar as matrizes de covariância observada e estimada. 
É a única medida que tem um teste estatístico direto quanto à 
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sua significância, e forma a base para muitas outras medidas 
de qualidade de ajuste. 

Reespecificação de modelo Modificação de um modelo exis- 
tente com parâmetros estimados para corrigir parâmetros 
inadequados encontrados no processo de estimação ou para 
criar um modelo concorrente para comparação. 

Relação de dependência Uma relação do tipo regressão re- 
presentada por uma seta de um só sentido que aponta de 
uma variável independente ou construto* para uma variável 
dependente ou construto. Relações típicas de dependência 
em SEM conectam construtos a variáveis medidas e constru- 
tos preditores a construtos resultantes. 

Relação estrutural Relação de dependência (do tipo regres- 
são) especificada entre dois construtos latentes quaisquer. 
Relações estruturais são representadas com uma seta em um 
só sentido e sugerem que um construto é dependente do ou- 
tro. Construtos exógenos não podem ser dependentes de ou- 
tro construto. Construtos endógenos podem ser dependentes 
de construtos exógenos ou endógenos (ver Capítulo 12 para 
mais detalhes). 

Relação ilegítima Uma relação que é falsa ou enganosa. Uma 
ocorrência comum na qual uma relação pode ser espúria é 
quando uma variável construto omitida explica causa e efeito 
(ou seja, a relação entre construtos originais se torna não-sig- 
nificante diante do acréscimo do construto omitido). 

Resíduo A diferença entre o valor real e o estimado para qual- 
quer relação. Em análises SEM, resíduos são as diferenças 
entre as matrizes de covariância observadas e estimadas por 
ajuste. 

Teoria Um conjunto sistemático de relações que fornece uma 
explicação consistente e abrangente de fenômenos. Na práti- 
ca, uma teoria é a tentativa de um pesquisador em especificar 
o conjunto inteiro de relações de dependência que explicam 
um conjunto particular de resultados. Uma teoria pode ser ba- 
seada em idéias geradas a partir de uma ou mais de três fon- 
tes principais: (1) pesquisa empírica prévia; (2) experiências 
passadas e observações de comportamento real, atitudes, 
ou outros fenômenos; e (3) outras teorias que fornecem uma 
perspectiva para análise. 

Validade de construto Extensão em que um conjunto de variá- 
veis medidas realmente representa o construto latente teórico 
que elas são projetadas para medir. Detalhes são discutidos 
no Capítulo 11. 

Variável estatística Uma combinação linear de variáveis medli- 
das que representa um construto latente. 

Variável latente Ver construto latente. 

Variável manifesta Ver variável medida. 

Variável medida Valor observado (medido) de um item ou ques- 
tão específica, obtido de respondentes em resposta a ques- 
tões (como em um questionário) ou a partir de algum tipo de 
observação. Variáveis medidas são usadas como indicadores 
de construtos latentes. O mesmo que variável manifesta. 


*N. de R.T.: A relação de dependência pode ocorrer entre construtos 
(em um sentido estrutural) ou entre construtos e variáveis (em um sen- 
tido de mensuração). 


O QUE É MODELAGEM DE 
EQUAÇÕES ESTRUTURAIS? 


Modelagem de equações estruturais (SEM) é uma fa- 
mília de modelos estatísticos que buscam explicar as 
relações entre múltiplas variáveis. Fazendo isso, ela 
examina a estrutura de inter-relações expressas em uma 
série de equações, semelhante a uma série de equações 
de regressão múltipla. Tais equações descrevem todas 
as relações entre construtos (as variáveis dependentes 
e independentes) envolvidos na análise. Construtos são 
inobserváveis ou fatores latentes representados por múl- 
tiplas variáveis (como variáveis representando um fator 
em análise fatorial). Até aqui, cada técnica multivaria- 
da foi classificada como uma técnica de dependência 
ou interdependência. A SEM pode ser vista como uma 
combinação única de ambos os tipos de técnicas, pois 
a fundamentação da SEM encontrada em dois métodos 
multivariados conhecidos: análise fatorial e análise de 
regressão múltipla. 

A SEM é conhecida por muitos nomes: análise estrutu- 
ral de covariância, análise de variável latente, e, às vezes, 
simplesmente pelo nome do pacote computacional espe- 
cializado usado (p.ex., um modelo LISREL ou AMOS). 
Apesar de diferentes caminhos poderem ser usados para 
testar modelos SEM, todos os modelos de equações estru- 
turais são distinguidos por três características: 


1. Estimação de relações de dependência múltiplas e inter- 
relacionadas 

2. Uma habilidade para representar conceitos não observados 
nessas relações e corrigir erro de mensuração no processo 
de estimação. 

3. Definição de um modelo para explicar o conjunto inteiro de 
relações 


Estimação de múltiplas relações de 
dependência inter-relacionadas 


A diferença mais óbvia entre SEM e outras técnicas mul- 
tivariadas é o uso de relações separadas para cada con- 
junto de variáveis dependentes. Em termos simples, SEM 
estima uma série de equações de regressão múltipla se- 
paradas, mas interdependentes, simultaneamente, pela 
especificação do modelo estrutural usado pelo programa 
estatístico. Primeiro, o pesquisador baseia-se em teoria, 
experiência prévia e nos objetivos da pesquisa para dis- 
tinguir quais variáveis independentes prevêem cada va- 
riável dependente. Em nosso exemplo anterior, primeiro 
queríamos prever imagem da loja. Em seguida queríamos 
usar imagem da loja para prever satisfação, sendo que 
ambas foram usadas para prever lealdade à loja. Assim, 
algumas variáveis dependentes se tornam independentes 
em relações subsequentes, dando origem à natureza inter- 
dependente do modelo estrutural. Além disso, muitas das 
mesmas variáveis afetam cada uma das variáveis depen- 
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dentes, mas com diferentes efeitos. O modelo estrutural 
expressa essas relações entre variáveis independentes e 
dependentes, mesmo quando uma variável dependente se 
torna independente em outras relações. 

As relações propostas são então traduzidas em uma 
série de equações estruturais (semelhantes a equações 
de regressão) para cada variável dependente. Essa carac- 
terística coloca SEM como um caso à parte das técnicas 
discutidas anteriormente que acomodam múltiplas variá- 
veis dependentes — análise multivariada de variância e 
correlação canônica — no sentido de que elas permitem 
apenas uma relação entre variáveis dependentes e inde- 
pendentes. 


Incorporação de variáveis latentes 
que não medimos diretamente 


A SEM também tem a habilidade de incorporar variáveis 
latentes na análise. Um construto latente (também cha- 
mado de variável latente) é um conceito teorizado e não 
observado que pode ser representado por variáveis obser- 
váveis ou mensuráveis. Ele é medido indiretamente pelo 
exame de consistência entre múltiplas variáveis medidas, 
algumas vezes chamadas de variáveis manifestas, ou indi- 
cadores, os quais são reunidos através de vários métodos 
de coleta de dados (como levantamentos, testes e méto- 
dos observacionais). 


Os benefícios do emprego de construtos latentes 
Porém, por que iríamos querer usar uma variável latente 
que não podemos medir diretamente, em vez de medidas 
exatas que os respondentes forneceram? Apesar de isso 
poder soar como uma abordagem absurda ou de “caixa- 
preta”, esse procedimento tem justificativa prática e teó- 
rica. Ou seja, ele melhora a estimação estatística, repre- 
senta melhor conceitos teóricos e explica diretamente o 
erro de mensuração. 


Melhoramento da estimação estatística A teoria es- 
tatística nos diz que um coeficiente de regressão é na 
realidade composto de dois elementos: o coeficiente 
estrutural verdadeiro entre a variável dependente e a 
independente, e a confiabilidade da variável preditora. 
Confiabilidade é um indicador do grau em que um con- 
junto de indicadores de um construto latente é interna- 
mente consistente com base em quão altamente inter- 
relacionados são os indicadores. Em outras palavras, ela 
representa a extensão em que todos eles medem a mes- 
ma coisa. Erro resulta no grau em que eles não medem a 
mesma coisa. É importante observar, porém, que mesmo 
elevada confiabilidade não garante que algum constru- 
to é medido com precisão. Esta conclusão envolve uma 
avaliação de validade, que será discutida no próximo ca- 
pítulo. Confiabilidade é uma condição necessária, porém 
não suficiente para validade. 


Em todas as técnicas multivariadas até aqui abordadas, 
consideramos que não tínhamos erro em nossas variáveis. 
Sabemos de perspectivas práticas e teóricas que não po- 
demos medir com perfeição um conceito e que sempre 
existe algum grau de erro de mensuração. Por exemplo, 
quando questionadas sobre algo tão direto quanto renda 
familiar, sabemos que algumas pessoas responderão incor- 
retamente, seja para exagerar ou para reduzir a quantia, 
ou simplesmente por não saberem o valor precisamente. 
As respostas dadas têm algum erro de mensuração, afe- 
tando desse modo a estimação do verdadeiro coeficiente 
estrutural. 

O impacto do erro de mensuração (e a correspon- 
dente confiabilidade diminuída) pode ser mostrado 
a partir de uma expressão do coeficiente de regressão 
como sendo 


Past, 


onde B,. é o coeficiente de regressão observado, B, é o 
verdadeiro coeficiente estrutural, e p, é a confiabilida- 
de da variável preditora. A menos que a confiabilidade 
seja de 100%, a correlação observada (e o coeficiente 
de regressão resultante) sempre subestimará a verda- 
deira relação. Esperamos fortalecer os coeficientes em 
nossos modelos de dependência e torná-los estimativas 
mais precisas dos coeficientes estruturais, de modo que a 
diminuição das correlações observadas seja atribuível a 
qualquer número de problemas de mensuração. 


Representação de conceitos teóricos. Erro de mensura- 
ção não é causado apenas por respostas imprecisas. Acon- 
tece também quando usamos conceitos mais abstratos ou 
teóricos, como motivações para comportamento ou cren- 
ças em geral (p. ex., patriotismo). Com conceitos como 
esses, o pesquisador tenta delinear as melhores questões 
para medir o conceito, sabendo que os indivíduos podem 
interpretar qualquer questão de maneira diferente, mas 
que o coletivo representará melhor o conceito do que 
qualquer item em especial [11]. Os respondentes também 
podem estar de algum modo inseguros sobre como res- 
ponder, ou podem interpretar as questões de um modo 
diferente daquele que o pesquisador pretendia transmitir. 
Ambas as situações podem originar erros de mensuração. 
Se conhecemos a magnitude do problema, podemos in- 
corporar a confiabilidade à estimação estatística e melho- 
rar nosso modelo de dependência. 


Especificação de erro de mensuração. Como explicamos 
erro de mensuração? A SEM fornece o modelo de mensu- 
ração, o qual especifica as regras de correspondência en- 
tre variáveis medidas e latentes. O modelo de mensuração 
permite ao pesquisador utilizar qualquer quantia de variá- 
veis para um só conceito independente ou dependente e 
então estimar (ou especificar) a confiabilidade. 
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Em nosso exemplo de imagem de loja, satisfação e leal- 
dade, cada um desses itens poderia ser definido como um 
construto latente que seria representado por um conjun- 
to de questões (como a escala múltipla introduzida no 
Capítulo 3). No modelo de mensuração, o pesquisador 
determina as questões específicas que são associadas 
com cada construto (p.ex., questões sobre qualidade es- 
tética são associadas com imagem, mas não com satis- 
fação ou lealdade). Em seguida, a SEM pode avaliar a 
contribuição de cada item na representação de seu cons- 
truto associado, medir quão bem um conjunto de medi- 
das representa o conceito (sua confiabilidade), e então 
incorporar tal informação à estimação das relações entre 
os construtos. 


Esse procedimento é semelhante a executar uma aná- 
lise fatorial dos itens de escala e usar os escores fatoriais 
na regressão. Essas semelhanças são discutidas em uma 
seção adiante deste capítulo. 


Distinção entre construtos latentes 

exógenos e endógenos 

Lembre-se que em regressão múltipla, análise discri- 
minante múltipla (MDA) e MANOVA era importante 
diferenciar variáveis independentes de dependentes. 
Analogamente, em SEM deve ser feita uma distinção 
assemelhada. Contudo, como agora estamos geralmente 
prevendo construtos latentes com outros construtos la- 
tentes, uma terminologia diferente é empregada. 

Construtos exógenos são os equivalentes latentes, 
multi-itens de variáveis independentes. Como tais, eles 
usam uma variável estatística de medidas para repre- 
sentar o construto, o qual atua como uma variável inde- 
pendente no modelo. Eles são determinados por fatores 
externos ao modelo (ou seja, não são explicados por 
qualquer outro construto ou variável no modelo), o que 
explica o termo independente. Modelos SEM são fre- 
quentemente descritos por um diagrama visual, tornando 
útil saber como descrever um construto exógeno. Uma 
vez que ele é independente de qualquer outro construto 
no modelo, visualmente um construto exógeno não apre- 
senta caminhos (setas em um só sentido) que cheguem ao 
mesmo a partir de outro construto ou variável. Discuti- 
mos as questões sobre construção de diagrama visual na 
próxima seção. 

Construtos endógenos são os equivalentes latentes, 
multi-itens de variáveis dependentes (ou seja, uma variá- 
vel estatística de variáveis dependentes individuais). Tais 
construtos são teoricamente determinados por fatores 
dentro do modelo. Assim, eles são dependentes de outros 
construtos, e esta dependência é visualmente representa- 
da por um caminho que chega em um construto endóge- 
no a partir de um exógeno (ou a partir de outro construto 
endógeno, como vemos adiante). 


Definição de um modelo 


Um modelo é uma representação de uma teoria. Uma 
teoria pode ser imaginada como um conjunto sistemá- 
tico de relações que fornecem uma explicação consis- 
tente e abrangente de fenômenos. A partir dessa defini- 
ção, percebemos que teoria não é domínio exclusivo da 
vida acadêmica, mas pode ser radicada na experiência e 
prática, pela observação do comportamento do mundo 
real. 

Um modelo convencional em terminologia SEM 
consiste, na verdade, de dois modelos, o de mensuração 
(representando como variáveis medidas se unem para 
representar construtos) e o modelo estrutural (que mos- 
tra como construtos são associados entre si). O Capítulo 
11 é dedicado à primeira parte da SEM, ou o modelo de 
mensuração, enquanto o Capítulo 12 trata de questões da 
segunda parte da SEM, que é o modelo estrutural. 


Importância da teoria 

Um modelo não deve ser desenvolvido sem alguma teoria 
inerente. Teoria, com freqiiência, é um objetivo básico da 
pesquisa acadêmica, mas praticantes podem desenvolver 
ou propor um conjunto de relações que são complexas 
e inter-relacionadas como qualquer teoria de origem 
acadêmica. Logo, pesquisadores de universidades e da 
indústria podem se beneficiar das ferramentas analíticas 
exclusivas fornecidas pela SEM. Discutimos em uma se- 
ção posterior questões específicas para o estabelecimento 
de uma base teórica para seu modelo SEM, particular- 
mente no que se refere à definição de causalidade. Em 
todos os casos, a análise SEM deve ser ditada por uma 
forte base teórica. 


Um retrato visual do modelo 

Um modelo SEM completo que consista de modelos de 
mensuração e estrutural pode ser bastante complexo. 
Existem muitas maneiras para especificar todas as rela- 
ções em uma notação matemática (ver Apêndice 10A 
para mais detalhes), mas muitos pesquisadores acham 
mais conveniente retratar um modelo de uma forma vi- 
sual conhecida como diagrama de caminhos. Este retrato 
visual das relações emprega convenções específicas tanto 
para construtos quanto para variáveis medidas e as rela- 
ções entre elas. 


Descrição dos construtos envolvidos em um modelo de 
equações estruturais. Construtos latentes podem ser re- 
lacionados com variáveis medidas via uma relação de de- 
pendência. Não se trata de uma relação de dependência 
entre construtos. Ao invés disso, variáveis medidas são 
consideradas como dependentes dos construtos. Assim, 
em uma SEM típica, a seta é desenhada dos construtos la- 
tentes para as variáveis que são indicadoras de construtos. 
Essas variáveis são chamadas de indicadores porque ne- 
nhuma variável isolada pode representar completamente 
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um construto, mas pode ser usada como indicadora do 
mesmo. O pesquisador deve justificar a base teórica dos 
indicadores, pois a SEM examina apenas as característi- 
cas empíricas das variáveis. O Capítulo 11 discute como 
avaliar a qualidade das mensurações resolvendo uma 
SEM. Aqui nos concentramos em como são descritas as 
relações de medidas. 

Os princípios básicos na construção de um diagra- 
ma de caminhos de um modelo de mensuração são os 
seguintes: 


e Auxiliar a distinguir os indicadores para construtos endó- 
genos versus exógenos; variáveis medidas (indicadores) 
para construtos exógenos são geralmente chamadas de 
variáveis X, enquanto indicadores de construtos endóge- 
nos são denotados por variáveis Y. 

e Comumente, construtos são representados por elipses ou 
círculos, enquanto variáveis medidas são representadas 
por quadrados. 

e As variáveis medidas X e/ou Y são associadas com seus 
respectivos construtos por uma seta que parte dos cons- 
trutos para a variável medida. 


A Figura 10-1a ilustra a maneira de descrever a rela- 
ção entre um construto e uma de suas variáveis medidas. 
Observe que possivelmente o construto será indicado por 
múltiplas variáveis medidas, e, assim, a descrição mais co- 
mum é aquela apresentada na Figura 10-1b. 


(a) Relação entre um 
construto e uma 


variável medida 


(b) Relação entre um 
construto e múltiplas 


variáveis medidas 


(c) Relação de dependência 
entre dois construtos 


(uma relação estrutural) 


(d) 


Relação via correlações 
entre construtos 


FIGURA 10-1 Tipos comuns de relações teóricas em um modelo SEM. 


a 


Descrição de relações estruturais. Um modelo estrutu- 
ral envolve a especificação de relações estruturais entre 
construtos latentes. A especificação de uma relação geral- 
mente significa que especificamos a existência ou não de 
uma relação. Se existe, uma seta é esboçada; se nenhuma 
relação é esperada, então nenhuma seta é desenhada. Em 
algumas ocasiões, a especificação também pode significar 
que um certo valor é especificado para uma relação. Dois 
tipos de relações são possíveis entre construtos: de depen- 
dência e correlacionais (covariância). 


Relações de dependência. Setas retas descrevem 
uma relação de dependência — o impacto de um constru- 
to sobre outro ou sobre uma variável. Em um sentido de 
mensuração, relações de dependência ocorrem de constru- 
tos para variáveis. Em um sentido estrutural, relações de 
dependência ocorrem entre construtos. As setas apontam 
do efeito antecedente (variável independente) para o sub- 
sequente ou resultado (variável dependente). Esta relação 
é descrita na Figura 10-1b. Em uma seção posterior, discu- 
timos questões envolvidas na especifica ção de causalida- 
de, que é uma forma especial de relação de dependência. 

A especificação de relações de dependência também 
determina se um construto é considerado exógeno ou 
endógeno. Lembre-se que um construto endógeno atua 
como uma variável dependente, e qualquer construto 
com um caminho de dependência (seta) apontando para 
o mesmo é considerado endógeno. Um construto exóge- 


Exógeno X 


Endógeno Y 


Exógeno 
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no tem apenas relações correlacionais com outros cons- 
trutos (ou seja, nenhum caminho de dependência che- 
gando ao construto). 


A Figura 10-2a ilustra visualmente um modelo SEM sim- 
ples via descrição de um único construto exógeno e um 
único endógeno. Primeiro, cada construto tem quatro in- 
dicadores denotados por X, a X, para os exógenos e Y, a 
Y, para os endógenos. Segundo, a relação de dependên- 
cia entre os construtos exógeno e endógeno é descrita 
pela seta retilínea entre eles. 


Relações correlacionais (covariância). Em alguns 
casos, o pesquisador deseja especificar uma correlação 
simples entre construtos exógenos. O pesquisador acredi- 
ta que os construtos são correlacionados, mas não assume 
que um é dependente do outro. Tal relação é descrita por 
uma conexão via seta de dois sentidos, como se mostra 
na Figura 10-1d. Um construto exógeno não pode com- 
partilhar este tipo de relação com um endógeno. Apenas 
uma relação de dependência pode existir entre construtos 
exógenos e endógenos. 


A Figura 10-2b mostra uma relação via correlação. Os 
dois construtos retêm os mesmos indicadores, mas duas 
mudanças a diferenciam da parte (a). Primeiro, os dois 
construtos podem agora ser exógenos, pois nenhuma 
relação de dependência aponta de um para o outro. Se- 
gundo, os quatro indicadores para o segundo construto 
(à direita no modelo) podem agora ser rotulados como 
variáveis X, pois eles correspondem a um construto exó- 


geno. Assim, as mesmas variáveis rotuladas Y, a Y, no 
primeiro modelo são agora X, a X,. As variáveis medi- 
das em si não mudaram nada, apenas suas designações 
no modelo. Finalmente, a seta reta é substituída por uma 
seta curva representando a relação por correlação. 


O pesquisador determina se construtos são exógenos 
ou endógenos com base na teoria sob teste. Cada cons- 
truto retém os mesmos indicadores. A única distinção é 
que o papel deles no modelo mudou. Um único modelo 
SEM pode conter relações tanto de dependência quanto 
correlacionais. 


Combinção de relações de dependência e correlacionais. A 
descrição de um conjunto de relações em um diagrama 
de caminhos tipicamente envolve uma combinação de re- 
lações de dependência e correlacionais entre construtos 
exógenos e endógenos. O pesquisador pode especificar 
qualquer combinação de relações que têm suporte teóri- 
co para as questões de pesquisa em mãos. Os exemplos a 
seguir ilustram como relações podem envolver elementos 
de dependência e correlacionais e ainda acomodar rela- 
ções inter-relacionadas. 


A Figura 10-3 mostra três exemplos de relações repre- 
sentadas por diagramas de caminhos, com as equações 
correspondentes. A Figura 10-3a exibe um modelo sim- 
ples de três construtos. X, e X, são construtos exógenos 
relacionados com o endógeno Y,, e a seta curvilínea en- 
tre X, e X, mostra os efeitos de intercorrelação (multico- 


linearidade) sobre a previsão. Podemos mostrar esta re- 
(Continua) 


(a) Relação de dependência 


Construto 
exógeno 


Construto 
endógeno 


ANRANEANES 


(b) Relação via correlação 


o CO a 


Construto 
exógeno 


Construto 
exógeno 


FADE SNDE NE: 


K||X||X||X% 


FIGURA 10-2 Representação visual de relações em modelos de mensuração e estrutural em um modelo SEM simples. 


548 Análise Multivariada de Dados 


Relações causais 


Diagrama de caminhos 


Variáveis Variáveis 
independentes dependentes FE 
X Xo == Y, N / 
(a) Y, 
O "s 
XX —— + Y Sa PA 
Xo Y ==" Yo == % 
(b) 
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FIGURA 10-3 Representação de relações de dependência e correlacionais por meio de diagramas de caminhos. 


(Continuação) 
lação com uma só equação, de forma parecida com o que 
fizemos em nossa discussão sobre regressão múltipla. 

Na Figura 10-3b, acrescentamos um segundo constru- 
to endógeno, Y,. Agora, além do modelo e da equação 
mostrada na Figura 10-3b, acrescentamos uma segun- 
da equação que mostra a relação entre X, e Y, com Y,. 
Aqui podemos perceber pela primeira vez o papel único 
desempenhado pela SEM quando mais de uma relação 
compartilha construtos. Queremos saber os efeitos de X, 
sobre Y,, os efeitos de X, sobre Y, e simultaneamente 
os efeitos de X, e Y, sobre Y,. Se não os estimássemos 
de uma forma consistente, não estaríamos seguros para 
representar seus efeitos separados e verdadeiros. Por 
exemplo, tal técnica é necessária para mostrar os efeitos 
de X, sobre Y, e Y,. 

As relações se tornam ainda mais entrelaçadas na Fi- 
gura 10-3c, com três construtos dependentes, cada um 
relacionado aos demais, bem como com os independen- 
tes. Uma relação recíproca (seta retilínea de dois sen- 
tidos) ocorre até mesmo entre Y, e Y,. Esta relação é 
exibida nas equações a partir do momento em que Y, 
aparece como preditor de Y,, e Y, como preditor de Y,. 
Não é possível expressar todas as relações nas Figuras 
10-3b ou 10-3c em uma única equação. Equações sepa- 
radas são exigidas para cada construto dependente. A 
necessidade de um método que possa estimar todas as 
equações simultaneamente é atendida pela SEM. 


Estes exemplos são apenas uma prévia quanto aos ti- 
pos de relações que podem ser retratadas e então empiri- 
camente examinadas através da SEM. Dada a habilidade 
dos modelos de se tornarem complexos muito facilmente, 


é até mais importante usar teoria como um fator guia para 
especificação dos modelos de mensuração e estrutural. 
Posteriormente, neste capítulo e nos Capítulos 11 e 12, 
discutimos os critérios pelos quais o pesquisador pode es- 
pecificar modelos SEM com mais detalhes. 


Quão bem o modelo se ajusta? 

É importante também lembrar que em contraste à análise 
de regressão ou outras técnicas de dependência, as quais 
buscam explicar relações em uma só equação, o objetivo 
estatístico da SEM é testar um conjunto de relações que 
representam múltiplas equações. Portanto, medidas de 
ajuste ou de precisão preditiva para outras técnicas (ou 
seja, Rº para regressão múltipla, precisão de classificação 
em análise discriminante, ou significância estatística em 
MANOVA) não são adequadas para SEM. O que se faz 
necessário é uma medida de ajuste ou precisão preditiva 
que reflita o modelo geral e não qualquer relação em es- 
pecial. Além disso, a maioria das demais técnicas multi- 
variadas decompõe a variância estatisticamente. A SEM 
analisa covariância, no lugar disso. Tal distinção é uma 
diferença importante em termos da teoria analítica e esta- 
tística inerente à SEM. 

A SEM usa uma série de medidas que descrevem quão 
bem a teoria de um pesquisador explica a matriz de cova- 
riância observada entre variáveis medidas. Se o modelo 
proposto estima propriamente todas as relações substan- 
tivas entre construtos, e o modelo de mensuração define 
adequadamente os construtos, então deveria ser possível 
a estimação de uma matriz de covariância entre variáveis 
medidas que se aproxime bastante da matriz de covari- 
ância observada. Discutimos com mais detalhes o pro- 
cesso de estimação de uma matriz de covariância a partir 
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do modelo proposto, juntamente com várias medidas de 
ajuste, em seções que se seguem neste capítulo, bem como 
nos Capítulos 11 e 12. 


Resumo 


A modelagem de equações estruturais examina uma série 
de relações de dependência simultaneamente. Ela é parti- 
cularmente útil quando uma variável dependente se torna 
independente em relações subsegiientes de dependência. 
Este conjunto de relações, cada uma com variáveis depen- 
dentes e independentes, é a base da SEM. Como vimos, 
uma fundamentação teórica válida para delinear uma aná- 
lise SEM é uma necessidade, pois a definição de modelos 
de mensuração e estruturais é completamente controlada 
pelo pesquisador. Distinções como aquela entre relações 
de dependência e as correlacionais ou as medidas associa- 
das com cada construto têm um profundo impacto sobre o 
modelo resultante. No entanto, com suporte teórico ade- 
quado, a SEM se torna uma poderosa ferramenta analítica 
para acadêmicos e profissionais que estudam relações com- 
plexas em muitas áreas. 


SEM E OUTRAS TÉCNICAS 
MULTIVARIADAS 


Todo construto de múltiplos itens em um modelo SEM 
pode ser imaginado como uma variável estatística. Logo, é 
claro que a SEM é uma técnica multivariada. A SEM é mais 
apropriada quando o pesquisador tem múltiplos constru- 
tos, cada um representado por diversas variáveis medidas, 
e estes construtos são distinguidos com base na informação 
de serem exógenos ou endógenos. Construtos exógenos são 
usados para prever e explicar os endógenos. Neste sentido, 
a SEM mostra semelhança com outras técnicas multivaria- 
das de dependência, como MANOVA e análise de regres- 
são múltipla. Além disso, o modelo de mensuração parece 
similar em forma e função com a análise fatorial. Discuti- 
mos as semelhanças de SEM com técnicas de dependência 
e de interdependência nas próximas seções. 


Similaridade com técnicas de dependência 


Uma semelhança óbvia da SEM é com regressão múltipla, 
uma das técnicas de dependência mais utilizadas. Relações 
para cada construto endógeno podem ser escritas em uma 
forma semelhante a uma equação de regressão. O constru- 
to endógeno é a variável dependente, e as independentes 
são os construtos com setas apontando para o construto 
endógeno. Uma diferença importante em SEM é que um 
construto que atua como variável independente em uma 
relação pode ser a variável dependente em outra. Assim, 
SEM permite que todas as relações/equações sejam simul- 
taneamente estimadas. 


A SEM também pode ser usada para representar 
outras técnicas de dependência. Ainda que as variáveis 
medidas em SEM sejam pelo menos ordinais e frequen- 
temente contínuas, variações dos modelos padrão SEM 
podem ser usadas para representarem variáveis categó- 
ricas não-métricas, e um modelo MANOVA pode, des- 
sa maneira, ser examinado usando-se SEM. Isso permi- 
te ao pesquisador tirar proveito da habilidade de SEM 
para acomodar erro de mensuração, por exemplo, em 
um contexto de MANOVA. 


Similaridade com técnicas de interdependência 


À primeira vista, o modelo de mensuração, associando 
variáveis medidas com construtos, parece idêntico à aná- 
lise fatorial, onde variáveis têm cargas sobre fatores (ver 
Capítulo 3 para uma discussão mais detalhada). Apesar 
dessa grande semelhança, como a interpretação da força 
da relação de cada variável com o construto (conhecida 
como uma carga em análise fatorial), uma diferença é 
crítica. A análise fatorial deste tipo é basicamente uma 
técnica de análise exploratória que busca por estrutura 
entre variáveis definindo fatores em termos de conjuntos 
de variáveis. Como tal, cada variável tem uma carga sobre 
cada fator. 

A SEM é o oposto de uma técnica exploratória. Ela re- 
quer que o pesquisador especifique quais variáveis são as- 
sociadas com cada construto, e então cargas são estimadas 
somente onde variáveis são associadas com construtos. A 
distinção não é tanto de interpretação quanto de modo 
de implementação. Análise fatorial exploratória não exi- 
ge qualquer especificação por parte do pesquisador. Em 
contrapartida, a SEM demanda especificação completa do 
modelo de mensuração. 

As vantagens do uso de medidas múltiplas para um 
construto, discutidas anteriormente e no Capítulo 3, são 
percebidas por meio do modelo de mensuração em SEM. 
Desse modo, os procedimentos de estimação para o mo- 
delo estrutural incluem uma correção direta para erro de 
medição. Fazendo isso, as relações entre construtos são 
estimadas com maior precisão. 


Resumo 


A SEM é a única técnica multivariada que permite a 
estimação simultânea de múltiplas equações. Essas 
equações representam a maneira como construtos se re- 
lacionam com itens de indicadores medidos, bem como 
o modo como construtos se relacionam entre si. Logo, 
quando técnicas SEM são empregadas para testar uma 
teoria estrutural, elas são equivalentes à execução de 
análise fatorial e análise de regressão em um passo. A 
SEM tem se tornado um método extremamente popu- 
lar nas ciências sociais por conta dessas vantagens es- 
tratégicas. 
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O PAPEL DA TEORIA EM MODELAGEM 
DE EQUAÇÕES ESTRUTURAIS 


A SEM jamais deve ser tentada sem uma forte base teórica 
para especificação dos modelos de mensuração e estrutural. 
As seções a seguir tratam de alguns papéis fundamentais de- 
sempenhados pela teoria em SEM: especificação de relações 
que definem o modelo e estabelecimento de causalidade, 
particularmente quando se usam dados de cross-section*. 


Especificação de relações 

Apesar de teoria poder ser importante em todos os proce- 
dimentos multivariados, ela é particularmente importante 
para a SEM, pois esta é considerada uma análise confir- 
matória; ou seja, ela é útil para testar e potencialmente 
confirmar uma teoria. Teoria é necessária para especificar 
relações em modelos estrutural e de mensuração, modi- 
ficações nas relações propostas, e muitos outros aspectos 
da estimação de um modelo. 

De um ponto de vista prático, uma abordagem teórica 
para SEM é necessária porque todas as relações devem 
ser especificadas pelo pesquisador antes que o modelo 
SEM possa ser estimado. Com outras técnicas multivaria- 
das, o pesquisador pode ser capaz de especificar um mo- 
delo básico e permitir valores pré-definidos (referenciais) 
nos programas estatísticos para “preencher” os demais 
aspectos de estimação. Esta opção de usar valores refe- 
renciais não é possível com SEM. Além disso, quaisquer 
modificações do modelo devem ser feitas mediante ações 
específicas do pesquisador. Assim, quando enfatizamos 
a necessidade de justificação teórica, salientamos que a 
SEM é um método confirmatório guiado mais por teoria 
do que por resultados empíricos. 


Estabelecimento de causalidade 


Talvez o tipo mais forte de inferência teórica que um pes- 
quisador pode esboçar é uma de natureza causal, a qual 
envolve a proposta de que uma relação de dependência é, 
na verdade, baseada em causalidade. Uma inferência cau- 
sal envolve uma relação presumida de causa e efeito. Se 
compreendemos a segiiência causal entre variáveis, então 
podemos explicar como alguma causa determina um dado 
efeito. Em termos práticos, o efeito pode ser pelo menos 
parcialmente administrado com algum grau de certeza. 
Logo, relações de dependência podem, às vezes, ser teori- 
camente assumidas como causais. Contudo, simplesmente 
imaginar que uma relação de dependência é causal não a 
torna de fato causal. Por isso usamos o termo causa com 
grande cuidado em SEM. 


*N. de R.T.: A expressão “cross-section” refere-se à seleção de um 
grupo de observações que é representativo da população ou univer- 
so do qual foi extraído, em um período de tempo específico. 


Por exemplo, se o gasto em compras do cliente pode ser 
demonstrado como causa do compromisso dele, então 
sabemos que compromisso pode ser estabelecido pelo 
aumento do gasto do cliente. Assim, políticas de marke- 
ting podem se focar no aumento do número de locações 
para um varejista, como um esforço para aumentar a fre- 
quiência relativa com a qual clientes as visitam, criando, 
portanto, os gastos dos mesmos. Se gastos e compromis- 
so estão causalmente relacionados como teorizado, esta 
mudança aumentará o compromisso da clientela. 


Planejamentos de pesquisa causal tradicionalmente 
envolvem um experimento com alguma manipulação con- 
trolada, o que significa uma variável independente cate- 
górica como encontrada em MANOVA ou ANOVA. Po- 
rém, modelos SEM são geralmente usados em situações 
não-experimentais nas quais os construtos exógenos são 
representados por variáveis indicadoras, e não variáveis 
experimentalmente controladas, o que limita a habilidade 
do pesquisador para esboçar inferências causais. Em últi- 
ma instância, a SEM por si só não pode estabelecer cau- 
salidade, mas pode fornecer alguma evidência necessária 
para embasar uma inferência causal. Nas seções a seguir, 
é feita uma breve discussão dos quatro tipos de evidência 
(covariação, sequência, covariação legítima e suporte te- 
órico) necessários para se estabelecer causalidade através 
de SEM [20, 37]. 


Covariação 

Como causalidade significa que uma variação em uma cau- 
sa provoca uma variação correspondente em um efeito, 
covariância sistemática (correlação) entre causa e efeito é 
necessária, mas não suficiente, para estabelecer causalida- 
de. Como se faz em regressão múltipla estimando-se a sig- 
nificância estatística de coeficientes de variáveis indepen- 
dentes que afetem a dependente, a SEM pode determinar 
covariação sistemática e estatisticamente significante en- 
tre construtos. Assim, caminhos estatisticamente signifi- 
cantes estimados no modelo estrutural (ou seja, relações 
entre construtos) fornecem evidência de que covariação 
está presente. Relações de dependência entre construtos 
são tipicamente os caminhos para os quais inferências 
causais são mais frequentemente teorizadas. 


Segiiência 

Uma segunda exigência para causalidade é a sequência 
temporal de eventos. Usemos nosso exemplo anterior 
como ilustração. 


Se uma variação em gastos de cliente conduz a uma va- 
riação no compromisso do mesmo, então a mudança no 


gasto do cliente não pode acontecer após a mudança em 
(Continua) 
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(Continuação) 

seu compromisso. Se imaginamos muitas peças de domi- 
nó enfileiradas e a primeira é derrubada por uma peque- 
na bola, isso pode provocar a queda de todas as demais 
peças. Em outras palavras, a batida da bola na primeira 
peça de dominó é a causa da queda das outras. Se a bola 
é a causa deste efeito, ela deve atingir o primeiro do- 
minó antes que os outros caiam. Se as demais peças de 
dominó caírem antes de a bola acertar a primeira, então 
a bola não pode ser a causa da queda delas. 


A SEM não pode fornecer este tipo de evidência sem 
um delineamento de pesquisa que envolva um experimen- 
to ou dados longitudinais. Um experimento pode fornecer 
este tipo de evidência a partir do momento que o pesqui- 
sador mantenha controle da variável causal por meio de 
manipulações. Assim, a pesquisa primeiramente mani- 
pula uma variável e então observa o efeito. Dados lon- 
gitudinais podem fornecer tal evidência porque eles nos 
permitem explicar o período de tempo em que eventos 
acontecem. Grande parte da pesquisa em ciências sociais 
depende de levantamentos em cross-section. Medir todas 
as variáveis no mesmo instante não fornece uma maneira 
para explicar a sequência temporal. Logo, teoria deve ser 
usada para argumentar que a sequência de efeitos é de um 
construto para outro. Em nosso exemplo, teoria deveria 
estabelecer que se é descoberta covariância entre os dois 
construtos, a mudança no gasto de clientes ocorre antes 
da mudança na compromisso. 


Covariância legítima 

Uma relação ilegítima é aquela que é falsa ou enganosa. 
Uma forma comum em que uma relação pode ser ilegíti- 
ma é quando outro evento não incluído na análise explica, 
na realidade, tanto causa quanto efeito. Muitas anedotas 
descrevem o que acontece com correlação ilegítima. 


Por exemplo, uma correlação significante entre consumo 
de sorvete e a possibilidade de afogamento pode ser em- 
piricamente verificada. No entanto, é seguro dizer que 
tomar sorvete provoca afogamento? Se procurássemos 
por outra causa em potencial (p.ex., temperatura é asso- 
ciada com aumento no consumo de sorvete e mais ativi- 
dades de natação), não encontraríamos qualquer relação 
real entre consumo de sorvete e afogamentos. 

Em nosso exemplo anterior, pode-se argumentar 
que gastos de clientela não provocam, na verdade, com- 
promisso. Uma explicação alternativa, por exemplo, é a 
crença de que preços baixos causam tanto gastos quanto 
compromisso. Se o construto de preço baixo é medido 
com os outros construtos e uma relação é especificada 
entre preço e gastos e compromisso de clientela, então 
um modelo SEM pode determinar se uma relação obser- 
vada é ilegítima. 


Condições sem colinearidade. Uma inferência causal 
se torna mais forte na medida em que podemos mostrar 
que um terceiro construto não afeta a relação entre causa 
e efeito. Covariância legítima tem recebido considerável 
atenção filosófica e analítica. Evidência apoiando a exis- 
tência de uma relação de dependência causal legítima 
entre dois construtos (ou variáveis) quaisquer deve ser 
flexível quando outros construtos são levados em conta. 
Em termos simples, o tamanho e a natureza da relação 
entre uma causa e o efeito relevante não devem ser afeta- 
dos pela inclusão de outros construtos (ou variáveis) em 
um modelo. Portanto, evidência causal é mais facilmente 
apresentada quando o conjunto de preditores para algum 
efeito é não relacionado com outro (ver Capítulo 4 sobre 
multicolinearidade). Quando colinearidade não está pre- 
sente, o pesquisador fica mais próximo de reproduzir as 
condições que estão presentes em um delineamento ex- 
perimental. Essas condições incluem variáveis preditoras 
experimentais ortogonais ou não-correlacionadas. 


Condições com multicolinearidade. Infelizmente, a 
maioria dos modelos estruturais envolve múltiplos cons- 
trutos preditores. Frequentemente, os construtos predi- 
tores exibem alguma relação (multicolinearidade) com 
os outros preditores e o construto efeito, tornando uma 
inferência causal menos evidente. Pode ser argumenta- 
do também que o erro observado de previsão deve ser 
não-relacionado com o construto causal, a fim de que evi- 
dência causal esteja presente. Logo, nos modelos SEM 
envolvendo pesquisa cross-section, evidência causal é su- 
portada em um âmbito maior quando a relação entre uma 
causa e um efeito permanece constante, mesmo quando 
outros construtos preditores são incluídos no modelo, 
e quando o erro do construto efeito é independente do 
construto causal [37, 42]. 


Teste de relações ilegítimas. A Figura 10-4 mostra um 
exemplo de teste para uma relação legítima. Um modelo 
SEM pode ser usado para testar se a verdadeira causa está 
relacionada com o efeito por meio de um teste de dois 
modelos SEM. Um deles especifica uma relação simples, 
e o segundo inclui outras causas potenciais como variá- 
veis preditoras também. Se a relação estimada entre cons- 
trutos permanece inalterada quando os preditores extras 
são adicionados, então a relação é considerada legítima. 
No entanto, se a relação se torna não-significante com o 
acréscimo dos demais preditores, então a relação deve ser 
considerada ilegítima. 


Neste exemplo, assuma que a SEM estima uma relação 
de 0,50 entre os construtos (Figura 10-4a). Para testar 
a legitimidade de uma relação, é proposto um modelo 
alternativo que sugere duas causas alternativas (Causa 
Alternativa I e Causa Alternativa II) que podem tornar 


ilegítima a relação entre a verdadeira causa e o efeito. O 
(Continua) 
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(a) Relação original 


A causa é 
significantemente 
relacionada 

com o efeito (0,5). 


Causa 
verdadeira 


(b) Teste de causas alternativas 


A causa não é 
afetada pelo 

acréscimo de duas 
causas potenciais 
alternativas 


Causa 
verdadeira 


Causa 
alternativa | 


0,0 


Causa 
alternativa Il 


FIGURA 10-4 Teste de legitimidade para uma relação entre construtos. 


(Continuação) 
modelo na Figura 10-4b descreve o modelo SEM alter- 


nativo que é estimado, incluindo os construtos originais, 
bem como duas causas alternativas como preditores adi- 
cionais tanto de causa quanto de efeito. Se os resultados 
são como os indicados na Figura 10-4b (ou seja, o coefi- 
ciente estimado de causa e efeito permanece inalterado), 
então a inferência causal é fortalecida. As causas alter- 
nativas não modificaram o resultado original, e assim 
esta análise comprova a legitimidade da relação original 
de causa e efeito. 


Suporte teórico 

A condição final para causalidade é suporte teórico, ou 
uma argumentação convincente para apoiar uma rela- 
ção de causa-e-efeito. Tal condição enfatiza o fato de 
que simplesmente testar um modelo SEM e analisar 
seus resultados não pode estabelecer causalidade. Su- 
porte teórico se torna especialmente importante com 
dados cross-section. Um modelo SEM pode demonstrar 
relações entre quaisquer construtos que são correlacio- 
nados com outro (p.ex., consumo de sorvete e estatísti- 
cas de afogamento). 


O gasto do cliente é causa de compromisso? Uma ar- 
gumentação teórica pode existir no fato de que quando 
clientes gastam mais recursos com uma firma (elevado 
gasto), eles se tornam mais familiarizados com a mesma, 
o que aumenta a satisfação e sua habilidade para iden- 
tificação com a loja ou a marca, e eles se tornam mais 


resistentes a mudanças. Logo, pode-se defender a idéia 
de que gastos maiores provocam maior compromisso. 


A menos que teoria possa ser usada para estabelecer 
uma ordem causal e uma argumentação para a covari- 
ância observada, as relações permanecem como simples 
associação e não devem ser atribuídas a qualquer poder 
causal adicional. 


Resumo 


Apesar de SEM ser frequentemente referida como uma 
modelagem causal, inferências causais somente são possí- 
veis quando evidência é consistente com as quatro condi- 
ções para causalidade já mencionadas. A SEM pode for- 
necer evidência de covariação sistemática e pode ajudar 
na demonstração de que uma relação não é ilegítima. Se 
os dados são longitudinais, a SEM também pode ajudar a 
estabelecer a sequência de relações. Contudo, depende do 
pesquisador o estabelecimento de suporte teórico. Assim, 
a SEM é útil para definir uma inferência causal, mas ela 
não pode fazer isso sozinha. 


A HISTÓRIA DA SEM 


A SEM é uma ferramenta analítica relativamente nova, 
mas suas raízes se remontam à primeira metade do século 
XX. O desenvolvimento da SEM se originou com a vonta- 
de de geneticistas e economistas de conseguir estabelecer 
relações causais entre variáveis [6, 15, 47]. Não obstante, a 
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complexidade matemática da SEM limitou sua aplicação 
até que computadores e programas se tornaram ampla- 
mente disponíveis. 

Como discutido, a SEM combina os princípios de aná- 
lise fatorial e regressão múltipla em um só procedimento. 
O trabalho de pesquisa e desenvolvimento inerente a es- 
sas duas técnicas revela a linhagem da SEM. Os avanços 
importantes vieram com o desenvolvimento de procedi- 
mentos estatísticos e de pacotes computacionais que via- 
bilizaram a combinação desses dois procedimentos multi- 
variados em um só. Durante o final da década de 1960 e 
início da de 1970, o trabalho de Jóreskog e Sórbom con- 
duziu à estimação simultânea de máxima verossimilhança 
das relações entre construtos e variáveis indicadoras me- 
didas, bem como entre construtos latentes. Este trabalho 
culminou no programa SEM chamado LISREL [22, 23, 
24, 25]. Não foi o primeiro programa a executar SEM ou 
análise de caminhos, mas foi o primeiro a conquistar am- 
plo uso. 

O crescimento de SEM se manteve relativamente len- 
to durante os anos 1970 e 1980, em grande parte devido à 
sua complexidade percebida. No entanto, em 1994, mais 
de 150 artigos sobre SEM foram publicados na literatu- 
ra acadêmica de ciências sociais. Este número subiu para 
mais de 300 em 2000, e hoje em dia, a SEM é a “técnica 
multivariada dominante”, seguida por análise de agrupa- 
mentos e MANOVA [17]. 


UM EXEMPLO SIMPLES DE SEM 


O exemplo a seguir ilustra como a SEM funciona com 
múltiplas relações, estimando muitas equações de uma 
só vez, mesmo quando elas estão inter-relacionadas e a 
variável dependente de uma equação é independente em 
outra(s). Tal capacidade permite ao pesquisador modelar 
relações complexas de uma maneira que não é viável com 
qualquer uma das outras técnicas multivariadas discutidas 
neste texto. 

Devemos observar, porém, que o nosso exemplo não 
ilustrará uma das outras vantagens da SEM, a habilida- 
de de empregar múltiplas medidas (o modelo de mensu- 
ração) para representar um construto de uma maneira 
semelhante à análise fatorial. Para fins de simplicidade, 
cada construto no exemplo a seguir é tratado como uma 
só variável. O Capítulo 11 discute teoria da mensuração 
e análise fatorial confirmatória e ilustra detalhadamente 
a mensuração de múltiplos itens. Por enquanto, nos con- 
centramos somente nos princípios básicos de construção 
de modelo e na estimação de múltiplas relações. 


A questão de pesquisa 
Teoria deve ser a fundamentação mesmo dos modelos 
mais simples, pois variáveis sempre podem ser conecta- 


das entre si de várias maneiras. A maioria dessas cone- 
xões não faz sentido. A teoria deve fazer do modelo algo 
plausível. A ênfase na representação de relações de de- 
pendência demanda que o pesquisador detalhe cuidado- 
samente não apenas o número de construtos envolvidos, 
mas as relações esperadas entre eles. Com esses constru- 
tos em mãos, modelos e a estimação de relações podem 
ter prosseguimento. 


Administradores do varejo estão interessados em como 
indivíduos se tornam clientes leais, comprometidos. As- 
sim, a questão-chave de pesquisa é: como percepções 
de clientela sobre três elementos estratégicos — preço, 
serviço e atmosfera — determinam a aceitação da loja, 
medida por gastos e compromisso? Mais especificamen- 
te, os varejistas acreditam que percepções favoráveis 
de preço, serviço e atmosfera encorajam um cliente a 
retornar e gastar mais dinheiro (aumentando gastos), e 
que através deste processo, clientes se tornam cada vez 
mais leais. 

A partir de suas experiências, eles desenvolveram 
uma série de relações que julgam explicar o processo: 


e Melhores percepções de preços aumentam os gastos de 
clientes. 

e Melhores percepções de serviços aumentam os gastos 
de clientes. 

e Melhores percepções de atmosfera da loja aumentam 
os gastos de clientes. 

e Maior gasto da clientela aumenta o compromisso dela. 


Essas quatro relações formam a base de como os ad- 
ministradores sentem que as componentes importantes 
de sua estratégia de venda (preço, serviço e atmosfera 
da loja) influenciam gastos e compromisso de cliente- 
la. Eles agora desejam compreender se suas estratégias 
são efetivas e, quem sabe, sua importância relativa. No 
entanto, a natureza inter-relacionada de suas relações 
(ou seja, gastos e compromisso de clientes) torna van- 
tajosa uma técnica com capacidades além da regressão 
múltipla. 


Preparação do modelo de equações 
estruturais para análise de caminhos 


Uma vez que uma série de relações é especificada, o 
pesquisador é capaz de identificar o modelo de uma for- 
ma adequada para análise. Construtos são identificados 
como sendo exógenos ou endógenos. Em seguida, para 
facilmente demonstrar as relações, elas são visualmen- 
te retratadas em um diagrama de caminhos, onde setas 
retas descrevem o impacto de um construto sobre outro. 
Se hipóteses causais são inferidas, as setas representando 
relações de dependência apontam da causa para o efeito 
subsegiente. 
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As relações identificadas pelos administradores de vare- 
jo incluem cinco construtos: percepções de preço, serviço 
e atmosfera da loja, bem como gastos e compromisso de 
clientela. O primeiro passo é identificar quais construtos 
podem ser considerados exógenos ou endógenos. A par- 
tir de nossas relações podemos identificar três construtos 
exógenos e dois endógenos: 


Construtos exógenos Construtos endógenos 


Preço Gastos de clientes 
Serviço Compromisso de clientes 
Atmosfera 


Com os construtos especificados, as relações podem 
ser representadas em um diagrama de caminhos. A Figu- 
ra 10-5 retrata as quatro relações sugeridas pelos admi- 
nistradores de varejo. 


Note que um tipo de relação também apresentada na 
Figura 10-5 não foi expresso pelos administradores: as 
correlações entre os construtos exógenos. Essas relações 
são tipicamente adicionadas em SEM quando o pesquisa- 
dor sente que os construtos exógenos têm algum grau de 
associação que faz surgir suas inter-relações. No caso de 
variáveis exógenas, isso é diretamente comparável à re- 
presentação de multicolinearidade discutida em regressão 
múltipla (ver Capítulo 4 para mais detalhes). Discutimos 
as várias razões para se adicionar este tipo de relação nos 
capítulos seguintes. 


Espera-se que os elementos separados da estratégia de 
vendas sejam coordenados e sigam planejamento e exe- 
cução consistentes, de forma que se permita correlação 
entre os três elementos estratégicos. Permitir relações 
entre construtos pode tornar as estimativas das relações 
de dependência mais confiáveis. 


Atmosfera 


FIGURA 10-5 Diagrama de caminhos de um modelo estrutural simples. 


Gastos 
de clientela 


Os pesquisadores agora podem reunir dados sobre 
percepções de clientes, seus gastos e lealdade, como a 
base para avaliação do modelo proposto. 


O básico da estimação e avaliação SEM 


Uma vez especificados relações e diagrama de caminhos, 
os pesquisadores podem agora reunir dados, colocá-los 
em um formato adequado para análise em SEM, estimar a 
força das relações, e avaliar o quão bem os dados se ajus- 
tam ao modelo. No exemplo, ilustramos os procedimentos 
básicos em cada um desses passos à medida que investiga- 
mos as questões levantadas por administradores que afe- 
tam compromisso de clientes. 


Matriz de covariância observada 

A SEM difere de outras técnicas multivariadas porque é 
um método de análise de estrutura de covariância e não 
uma técnica de análise de variância. Como resultado, a 
SEM foca a covariação entre as variáveis medidas, ou a 
matriz de covariância da amostra observada. Apesar de 
nem sempre parecer óbvio para o usuário, programas 
SEM podem usar como entrada a matriz de covariância 
ou uma matriz de correlação de variáveis observadas. 

O leitor pode indagar se faz alguma diferença se 
usarmos uma matriz de covariância no lugar de uma ma- 
triz de correlações, como se faz em regressão múltipla. 
Discutimos as vantagens de uma matriz de covariância 
posteriormente neste capítulo (estágio 3 do processo de 
decisão), mas devemos lembrar que correlação é apenas 
um caso especial de covariância. Uma matriz de correla- 
ção é simplesmente a matriz de covariância quando va- 
riáveis padronizadas são empregadas (ou seja, a matriz 
de covariância padronizada). Somente valores abaixo 
da diagonal são únicos e de interesse particular quando 
o foco é sobre correlações. O ponto-chave até este mo- 
mento é perceber que a matriz de covariância observada 
pode simplesmente ser computada a partir de observa- 


Compromisso 
de clientela 
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ções amostrais, como fizemos na computação de uma 
matriz de correlação. Ela não é estimada e nem depende 
de modelo imposto por um pesquisador. 


Examinemos novamente nosso exemplo com estraté- 
gia de vendas e vejamos como os pesquisadores prosse- 
guiriam depois que o modelo é definido. 


Para entender como dados entram em SEM, pense na ma- 
triz de covariância entre as cinco variáveis. Assim, a ma- 
triz de covariância observada conteria 25 valores. Os cinco 
valores da diagonal representam a variância de cada variá- 
vel, resultando em 10 termos de covariância únicos. Pelo 
fato de a matriz de covariância ser simétrica, os 10 termos 
únicos são repetidos acima e abaixo da diagonal. 


var(P) cov(P,S) 
Covariância |OY(PS)  var(S) 
observada =/|Cov(PA) cov(SA) 

cov(PCS) cov(S,CS) 

cov(P,CC) cov(S,CC) 


Os valores que não estão em negrito acima da diagonal 
representam os 10 termos únicos que são os mesmos que 
estão abaixo da diagonal. Dada essa duplicação, matrizes 
de covariância ou de correlação são geralmente expressas 


Suponha em nosso exemplo que os termos de cova- 
riância únicos para Preço, Serviço, Atmosfera, Gastos e 


Valores para os itens de variância não são mostrados, 
mas esta é uma simples questão de se computar tais valo- 
res e incluí-los na matriz de covariância. Se os dados são 
padronizados, resultaria uma matriz de correlação e cada 


Por exemplo, suponha que a amostra envolve clientes 
entrevistados usando uma técnica de abordagem em pon- 
to de fluxo. Assim, a matriz de covariância resultante é 
composta dos seguintes valores, com cada construto sim- 
plesmente abreviado como P para Preço, S para Serviço, 
A para Atmosfera, CS para Gastos de Cliente e CC para 
Compromisso de Cliente (como na Figura 10-5): 


cov(PA) cov(PCS) cov(P,CC) 
cov(S,A) cov(S,CS) cov(S,CC) 
var(A) cov(A,CS) cov(A,CC) 
cov(A,CS) var(CS) cov(CS,CC) 


cov(A,CC) cov(CS,CC) var(CC) 


como uma matriz simétrica, com os termos únicos mostra- 
dos somente abaixo da diagonal. 

A matriz completa de covariância para os cinco cons- 
trutos é expressa como se segue em uma matriz simétrica: 


var(P) 
Covariância cov(P,S)  var(S) 
observada (S) — cov(P,A) cov(S,A) var(A) 
cov(PCS) cov(S,CS) cov(A,CS) var(CS) 
cov(P,CC) cov(S,CC) cov(A,CC) cov(CS,CC) var(CC) 


Compromisso foram registrados como indicado aqui: 


Gastos de Compromisso 
Preço Serviço Atmosfera Clientes de Clientes 
vo | var(P) = = e = 
Sn | OM mr 
0,20 0,15 var (A) — — 
0,20 0,30 0,50 var (CS) - 
— 0,05 0,25 0,40 0,50 var (CC) 


termo de variância se tornaria igual a um. Valores acima 
da diagonal também não são repetidos para manter a ma- 
triz de covariância tão simples quanto possível para fins de 
ilustração. 
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Estimação e interpretação de relações 

Antes do amplo emprego de programas SEM, pesqui- 
sadores achavam soluções para modelos de múltiplas 
equações usando um processo conhecido como análise de 
caminhos. Análise de caminhos utiliza correlações biva- 
riadas simples para estimar as relações em um sistema de 
equações estruturais. Este processo estima a força de cada 
relação retratada como uma seta reta ou curvilínea em um 
diagrama de caminhos. O procedimento matemático real 
é brevemente descrito no Apêndice 104. 


Procedimentos de análise de caminhos (Apêndice 104) 
podem fornecer estimativas para cada relação (seta) no 
modelo mostrado na Figura 10-6. Essas estimativas são 
comparáveis com coeficientes de regressão, onde duas 
equações separadas seriam usadas (uma para prever 
Gastos de Cliente, e a segunda para prever Compro- 
misso de Clientes), e portanto uma equação não contém 
a informação representada pela outra equação. Com 
técnicas SEM, contudo, todas as estimativas podem ser 
computadas usando-se toda a informação de todas as 
equações que compõem um modelo. 

Além disso, a SEM fornece estimativas diretas das 
relações entre os construtos exógenos, o que pode ter 
implicações em nossa interpretação dos resultados e 
também influenciar diretamente nossa avaliação da va- 
lidade dos construtos exógenos. 


Com estimativas para cada caminho, uma interpreta- 
ção pode ser feita de cada relação representada no mode- 
lo. Quando testes de inferência estatística são aplicados, 
o pesquisador pode avaliar a probabilidade de que as es- 
timativas sejam significantes (ou seja, não iguais a zero). 


Além disso, as estimativas podem ser usadas como coefi- 
cientes de regressão para fazer estimativas dos valores de 
qualquer construto no modelo. 


Caminhos no modelo mostrados na Figura 10-6 repre- 
sentam as questões de pesquisa colocadas pelo pesqui- 
sador. Quando olhamos as primeiras três relações (ou 
seja, impacto de Preço, Serviço e Atmosfera sobre Gas- 
tos de Clientes) podemos perceber que os coeficientes 
estimados são 0,065, 0,219 e 0,454, respectivamente. Sem 
fazer um julgamento estatístico, podemos averiguar que 
Atmosfera tem o maior impacto, enquanto Serviço tem 
um pouco menos e Preço tem o menor impacto. Além 
disso, podemos ver que Gastos de Cliente tem um im- 
pacto substancial sobre Compromisso de Clientes (0,50) 
e fornece evidência daquela relação também. 


Agora lembre do Capítulo 4 que coeficientes de re- 
gressão podem ser usados para computar valores previstos 
para variáveis dependentes. Tais valores foram chamados 
de y. Logo, para quaisquer valores particulares das variá- 
veis preditoras, um valor estimado para o resultado po- 
deria ser obtido. Neste caso no qual tratamos construtos 
como variáveis, eles representariam valores previstos para 
construtos endógenos, que é o resultado. A diferença entre 
o valor observado real para o resultado e é erro. A SEM 
pode também fornecer valores estimados para construtos 
exógenos quando múltiplas variáveis são usadas para indi- 
car o construto. Tal processo fica mais claro nos próximos 
capítulos. Perceba que diversas relações potenciais entre 
construtos não têm caminhos desenhados, o que significa 
que o pesquisador não espera uma relação direta entre 
esses construtos. Por exemplo, nenhuma seta é esboçada 


Compromisso 
de cliente 


FIGURA 10-6 Modelo estimado de equações estruturais para compromisso de cliente. 
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entre Preço e Compromisso de Cliente, Serviço e Compro- 
misso de Cliente, ou Atmosfera e Compromisso de Clien- 
te, o que afeta as equações para os valores previstos. 


Em nosso modelo, se tomamos quaisquer valores para 
Preço, Serviço e Atmosfera, podemos estimar um valor 
para Gastos de Cliente usando esta equação: 


Ys= 0,065(Preço) + 0,219(Serviço) + 0,454(Atmosfera) 


Analogamente, valores previstos para Compromisso 
de Cliente podem ser obtidos: 


Ye = 0,50(CS) 


Isso representaria uma previsão de equação múltipla, 
pois CS é também endógeno. Substituindo a equação 
para CS na equação para CC, obtemos: 


Yo = 0,50[0,065(Preço) + 0,219(Serviço) 
+ 0,454(Atmosfera)] 


Portanto, é fácil perceber como estimativas de cami- 
nhos na Figura 10-6 podem ser usadas para calcular va- 
lores estimados para Gastos de Cliente e Compromisso 
de Cliente. 


Avaliação do ajuste de modelo com a 

matriz de covariância estimada 

O último passo em uma análise SEM envolve o cál- 
culo de uma matriz de covariância estimada e então a 
avaliação do grau de ajuste do modelo de covariância 
observada. A matriz de covariância estimada é obtida 
a partir das estimativas de caminhos do modelo. Com 
essas estimativas, podemos calcular todas as covariân- 
cias que estavam na matriz de covariância observada 
usando os princípios de análise de caminhos no sentido 
“contrário”. Em seguida, comparando as duas matrizes, 
a SEM pode testar um modelo. Modelos que produzem 
uma matriz de covariância estimada que está dentro da 
variação amostral da matriz de covariância observada 
são geralmente considerados como bons modelos e que 
se ajustam bem. 

O processo de calcular uma covariância estimada pri- 
meiramente identifica todos os caminhos diretos e indire- 
tos que se relacionam com uma covariância ou correlação 
específica. Então, os coeficientes são usados para calcular 
o valor de cada caminho, os quais são em seguida totaliza- 
dos para se conseguir o valor estimado para cada covariân- 
cia/correlação. 


Examinemos uma relação (Serviço e Gastos de Cliente) 
para ilustrarmos o que acontece. Eles envolvem cami- 


Caminho direto: 
Serviço —> Gastos de Cliente = 0,219 
Caminhos indiretos: 


Serviço —> Preço —> Gastos de Cliente = 0,200 X 0,065 = 0,013 
Serviço —> Atmosfera —> Gastos de Cliente = 0,150 X 0,454 = 0,068 


Total: Direto + Indireto = 0,219 + 0,013 + 0,068 = 0,300 


Assim, a covariância estimada entre Serviço e Gas- 
tos de Cliente é 0,300, a soma de caminhos diretos e in- 
diretos. 


Gastos de Compromisso 
Preço Serviço Atmosfera Clientes de Clientes 
Covariância E o o E o 
: 0,20 - = = = 
Estimada (5,) 020 015 o N o 
0,20 0,30 0,50 - = 
0,10 0,15 0,25 0,50 - 


nhos diretos e indiretos: 


Analogamente, podemos imaginar a matriz de covariân- 
cia estimada como as covariâncias obtidas das estimativas 
de todas as variáveis y. A matriz completa de covariância 
estimada é dada por: 
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A diferença entre as matrizes de covariância observada 
e estimada, IS — X,|, se torna o guia principal na avaliação 
do ajuste de um modelo SEM. Se a matriz de covariância 
estimada é suficientemente próxima da matriz de covari- 
ância observada (a diferença é pequena), então o modelo 
e suas relações são corroborados. Se o leitor está familia- 
rizado com tabulação cruzada, não deve ser surpresa que 
uma estatística x possa ser computada com base na dife- 
rença entre as duas matrizes. Posteriormente, usaremos 
esta estatística como o indicador básico da qualidade do 
ajuste de um modelo teórico. 

A última questão na avaliação de ajuste é o conceito 
de resíduo em SEM. Aqui, um resíduo é a diferença en- 
tre qualquer covariância observada e estimada. Assim, 
quando comparamos as matrizes de covariância obser- 
vada e reais*, quaisquer diferenças que detectamos são 
os resíduos. A distinção em relação a outras técnicas 
multivariadas, especialmente regressão múltipla, é im- 
portante. Em tais técnicas, resíduos refletem os erros na 
previsão de observações individuais. Em SEM, observa- 
ções individuais não são o foco da análise, a despeito de 
valores previstos para observações individuais poderem 
ser computados. Quando um programa SEM se refere a 
resíduos, isso significa o quão distante um termo de co- 
variância estimada está da covariância observada para 
as mesmas duas variáveis. 


Ao se comparar nossas matrizes de covariância obser- 
vada e estimada, algumas covariâncias são previstas 
com precisão e algumas diferenças são descobertas. Por 
exemplo, a relação entre Serviço e Gastos de Cliente é 
prevista com precisão. Em outros casos, como o da rela- 
ção Atmosfera —> Compromisso de Cliente, a covariân- 
cia estimada (0,25) é claramente distinta da observada 
(0,40). Quando examinamos os resultados, percebemos 
resíduos para cada relação de construto exógeno com 
Compromisso de Cliente (-0,15, 0,10 e 0,15). Portanto, o 
modelo descrito não explica com perfeição a covariância 
entre esses itens e pode sugerir que a teoria do pesquisa- 
dor é inadequada. 


Com essas regras simples, o modelo como um todo 
pode agora ser construído simultaneamente. Observe 
que variáveis dependentes em uma relação podem fa- 
cilmente ser independentes em outra (como ocorre com 
Gastos de Cliente). Não importa quão grande o diagra- 
ma de caminhos fique ou quantas relações sejam incluí- 
das, a análise de caminhos fornece uma maneira de ana- 
lisar o conjunto de relações. 


*N. de R.T.: A frase correta seria “quando comparamos as ma- 
trizes de covariância observada e estimada”. 


Devemos observar que o pesquisador não tem que 
fazer todos os cálculos na análise de caminhos, pois eles 
podem ser realizados pelo programa computacional. O 
pesquisador precisa compreender os princípios inerentes 
a SEM, de forma que as implicações do acréscimo ou eli- 
minação de caminhos ou outras modificações do modelo 
sejam entendidas. Os próximos dois capítulos explicam 
como tais procedimentos são implementados no teste de 
teorias de mensuração e estrutural, respectivamente. 


Resumo 


A SEM provê um referencial abrangente para estimar 
conjuntos complexos de relações e incorporar proprieda- 
des específicas de mensuração de construtos latentes tam- 
bém. Neste exemplo, ilustramos os processos básicos de 
especificação de um modelo, entrando com dados em um 
formato para SEM, estimando relações e avaliando ajuste 
de modelo. Mesmo neste modelo simples, fica evidente a 
importância da teoria na orientação da especificação do 
modelo. As seções a seguir e os Capítulos 11 e 12 tratam 
de questões que surgem quando modelos ficam mais com- 
plexos, envolvendo múltiplas medidas. Não obstante, os 
procedimentos básicos ainda são comparáveis com aque- 
les descritos neste exemplo. 


DESENVOLVIMENTO DE UMA 
ESTRATEGIA DE MODELAGEM 


Um dos conceitos mais importantes que um pesquisador 
deve aprender no tocante a técnicas multivariadas é que 
não existe um só caminho correto para aplicá-las. Ao invés 
disso, o pesquisador deve formular os objetivos da pesqui- 
sa e aplicar técnicas apropriadas da maneira mais adequa- 
da para atingir os objetivos desejados. Em alguns casos, as 
relações são estritamente especificadas e o objetivo é uma 
confirmação da relação. Em outras vezes, as relações são 
vagamente reconhecidas e a meta é a descoberta das rela- 
ções. Em cada caso extremo e em pontos intermediários, 
o pesquisador deve formular o uso da técnica de acordo 
com os objetivos da pesquisa. 

A aplicação da SEM segue essa mesma doutrina. Sua 
flexibilidade fornece ao pesquisador uma poderosa ferra- 
menta analítica adequada para muitos objetivos de pes- 
quisa. Pesquisadores devem definir esses objetivos como 
orientações em uma estratégia de modelagem. O empre- 
go do termo estratégia é projetado para denotar um plano 
de ação para um resultado específico. No caso da SEM, o 
resultado fundamental é sempre a avaliação de uma sé- 
rie de relações. No entanto, isso pode ser conseguido por 
muitos caminhos. Para nossos propósitos, definimos três 
estratégias distintas na aplicação de SEM: estratégia de 
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modelagem confirmatória, modelos concorrentes, e de- 
senvolvimento de modelos. 


Estratégia de modelagem confirmatória 


A aplicação mais direta de modelagem de equações es- 
truturais é uma estratégia de modelagem confirmatória. 
O pesquisador especifica um só modelo (conjunto de re- 
lações), e a SEM é usada para avaliar quão bem o modelo 
se ajusta aos dados. Aqui o pesquisador está dizendo “Isto 
ou funciona, ou não funciona”. Se o modelo proposto tem 
ajuste aceitável por quaisquer critérios aplicados, o pes- 
quisador não demonstrou o modelo proposto, mas apenas 
confirmou que ele é um entre diversos possíveis modelos 
aceitáveis. Trata-se do oposto de técnicas exploratórias 
como a regressão stepwise. Diversos modelos diferentes 
podem ter ajustes igualmente aceitáveis. Talvez um tes- 
te mais esclarecedor seja conseguido pela comparação de 
modelos alternativos. 


Estratégia de modelos concorrentes 


Como um meio de comparar o modelo estimado com al- 
ternativos, comparações gerais podem ser feitas em uma 
estratégia de modelos concorrentes. O teste mais forte de 
um modelo proposto é identificar e testar modelos con- 
correntes que representam relações estruturais hipotéticas 
verdadeiramente diferentes. Quando compara esses mo- 
delos, o pesquisador se aproxima muito mais de um teste 
de teorias que competem, o que é muito mais forte do que 
apenas uma pequena modificação de uma só teoria. 


Como o pesquisador gera esse conjunto de modelos con- 
correntes? Uma possível fonte de modelos concorrentes 
consiste em formulações alternativas da teoria subjacen- 
te. Por exemplo, em nosso modelo original, Compromis- 
so de Cliente foi determinado diretamente apenas por 
Gastos de Cliente (Figura 10-5). No entanto, um modelo 
alternativo poderia propor que Compromisso de Cliente 
poderia também ser diretamente determinado por At- 
mosfera (adicionando uma seta retilínea de Atmosfera 
para Compromisso de Cliente). Este seria, então, o mo- 
delo concorrente em relação ao original. 


Modelos equivalentes fornecem uma segunda pers- 
pectiva no desenvolvimento de um conjunto de modelos 
concorrentes. Foi mostrado que para qualquer modelo de 
equações estruturais, existe pelo menos um outro modelo 
com o mesmo número de parâmetros e o mesmo nível de 
ajuste que varia nas relações retratadas. Como uma nor- 
ma prática geral, quanto mais complexo o modelo, mais 
modelos equivalentes existem. 

Um terceiro exemplo de estratégia de modelos con- 
correntes é o processo de avaliar invariância fatorial, a 


igualdade de modelos fatoriais ao longo de grupos. Este 
processo é ilustrado nos capítulos subsequentes. 


Estratégia de desenvolvimento de modelos 


A estratégia de desenvolvimento de modelos difere das 
duas anteriores no sentido de que, apesar de uma estru- 
tura de modelo básico ser proposta, o propósito do esfor- 
ço de modelagem é melhorar esta estrutura por meio de 
modificações dos modelos estrutural ou de mensuração. 
Em muitas aplicações, a teoria pode fornecer apenas um 
ponto de partida para o desenvolvimento de um mode- 
lo teoricamente justificado que pode ser empiricamente 
apoiado. Assim, o pesquisador deve empregar SEM não 
apenas para testar o modelo empiricamente, mas também 
para fornecer idéias sobre sua reespecificação. 

Uma nota de cuidado deve ser feita. O pesquisador 
deve ser cuidadoso para não empregar essa estratégia ao 
ponto em que o modelo final tenha ajuste aceitável mas 
que não possa ser generalizado para outras amostras ou 
populações. Além disso, a reespecificação de modelo sem- 
pre deve ser feita com suporte teórico e não apenas com 
justificativa empírica. Modelos desenvolvidos dessa ma- 
neira devem ser verificados com uma amostra indepen- 
dente. Discutimos isso nos próximos capítulos. 


REGRAS PRÁTICAS 10-1 


Introdução à modelagem de equações estruturais 


e Nenhum modelo deve ser desenvolvido para uso com 
SEM se não houver alguma teoria subjacente, a qual é 
necessária para desenvolver: 

e Especificação de modelo de mensuração 

e Especificação de modelo estrutural 

Modelos podem ser visualmente representados com um 

diagrama de caminhos 

e Relações de dependência são retratadas por setas 
em um só sentido 

e Relações correlacionais (covariância) são 
representadas por setas em dois sentidos 

Relações de dependência são, às vezes, mas nem 

sempre, teorizadas como sendo causais por natureza; 

relações causais são o mais forte tipo de inferência feita 

na aplicação de estatísticas multivariadas; logo, elas 

só podem ser embasadas quando existirem condições 

precisas para causalidade: 

e Covariância entre causa e efeito 

e A causa deve ocorrer antes do efeito 

e Deve existir associação legítima entre causa e efeito 

e Há suporte teórico para a relação entre causa e efeito 

Modelos desenvolvidos com uma estratégia de 

desenvolvimento devem passar por validação cruzada 

com uma amostra independente 
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SEIS ESTÁGIOS NA MODELAGEM 
DE EQUAÇÕES ESTRUTURAIS 


A SEM se tornou uma abordagem multivariada popular 
em um intervalo de tempo relativamente curto. Pesqui- 
sadores são atraídos para a SEM porque ela provê uma 
maneira conceitualmente atraente de testar uma teoria. 
Se um pesquisador pode expressar uma teoria em termos 
de relações entre variáveis medidas e construtos latentes 
(variáveis estatísticas), então a SEM avaliará quão bem 
a teoria se ajusta à realidade quando esta é representada 
por dados. 

Esta seção continua a discussão sobre a SEM des- 
crevendo um processo de decisão em seis estágios. Este 
processo varia um pouco em relação àquele introduzido 
no Capítulo 1 a fim de refletir a terminologia e os pro- 
cedimentos únicos da SEM. Os seis estágios são como 
se segue: 


1. Definir construtos individuais 

2. Desenvolver o modelo de mensuração geral 

3. Planejar um estudo para produzir resultados empíricos 
4. Avaliar a validade do modelo de mensuração 

5. Especificar o modelo estrutural 

6. Avaliar a validade do modelo estrutural 


O restante deste capítulo fornece uma breve visão ge- 
ral introdutória desses seis estágios, que serão discutidos 
também com mais detalhes nos próximos dois capítulos. 
No lugar de incluir um exemplo HBAT como ilustração 
da técnica neste capítulo, o mesmo será apresentado no 
próximo. Os dois capítulos que se seguem são devotados 
ao teste dos modelos de mensuração e estrutural, respecti- 
vamente. Muitas análises SEM envolvem o teste da teoria 
de mensuração (como os construtos são representados) e 
da teoria estrutural (como os construtos se relacionam en- 
tre si). A ilustração da HBAT é coberta em ambos os ca- 
pítulos. O Capítulo 11 cobre os primeiros quatro estágios 
da SEM, enquanto o Capítulo 12 trata dos dois estágios 
restantes. 


Estágio 1: Definição de construtos individuais 


Uma boa teoria de mensuração é uma condição necessá- 
ria para se obter resultados úteis a partir da SEM. Tes- 
tes de hipóteses envolvendo as relações estruturais entre 
construtos não serão mais confiáveis ou válidos do que o 
modelo de mensuração que explica como esses construtos 
são construídos. O pesquisador deve investir significativo 
tempo e esforço no início do processo de pesquisa para 
garantir que a qualidade de medição permita a obtenção 
de conclusões válidas. 


Operacionalização do construto 

O processo começa com uma boa definição dos constru- 
tos envolvidos. Esta definição deve, então, fornecer a base 
para a seleção ou planejamento de itens indicadores in- 


dividuais. Um pesquisador operacionaliza um construto 
selecionando seus itens de escala de mensuração e tipo 
de escala. Em pesquisas de levantamentos, a operacio- 
nalização de um construto frequentemente envolve uma 
série de itens de escala em um formato comum, como a 
escala Likert ou uma escala diferencial semântica. As de- 
finições e itens são derivados a partir de duas abordagens 
comuns. 


Escalas de pesquisa anterior. Em muitos casos, constru- 
tos podem ser definidos e operacionalizados da mesma 
maneira como foram em estudos prévios. Pesquisadores 
podem fazer uma busca na literatura sobre os construtos 
individuais e identificar escalas que tiveram bom desem- 
penho anterior. Muita pesquisa atualmente utiliza escalas 
que foram publicadas em periódicos especializados ou que 
estão disponíveis mediante solicitação direta ao autor. 


Por exemplo, se um pesquisador precisa medir apoio do 
supervisor, muitos estudos fornecem definições úteis e 
os correspondentes itens de escala. Como exemplo, um 
estudo define apoio do supervisor como a transferência 
de recursos emocionais ou instrumentais para um co- 
lega a partir de seu superior no ambiente de trabalho. 
Três itens Likert são fornecidos como indicadores deste 
construto. Os itens avaliam em que medida o emprega- 
do percebe seu supervisor como alguém que ouve quan- 
do ocorrem problemas, como uma pessoa confiável em 
situações difíceis e como um colaborador na tarefa de 
realizar um trabalho [21]. 


Desenvolvimento de nova escala. Medidas de cons- 
trutos podem ser desenvolvidas. Tal desenvolvimento é 
apropriado quando um pesquisador está estudando algo 
que não tem uma história rica de pesquisas anteriores. 
O processo geral de desenvolvimento de itens de escala 
pode ser longo e detalhado. O essencial deste processo é 
destacado no próximo capítulo, mas o leitor deve consul- 
tar outras fontes para uma discussão mais completa [11]. 


Pré-teste 

Geralmente, quando medidas são desenvolvidas para 
um estudo ou quando elas são obtidas de várias fon- 
tes, algum tipo de pré-teste deve ser feito. O pré-teste 
deve usar respondentes semelhantes àqueles da popula- 
ção a ser estudada, de modo a se resguardar quanto a 
adequação. Pré-testes são particularmente importantes 
quando escalas são aplicadas em contextos específicos 
(p.ex., situações de compras, indústrias ou outros casos 
nos quais especificidade é imperativa) ou contextos fora 
de seus usos normais. Testes empíricos dos resultados de 
pré-teste são feitos de uma maneira idêntica à análise de 
modelo final (ver discussão no estágio 4, adiante neste 
capítulo). Itens que estatisticamente não se comportam 
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como o esperado podem precisar de refinamento ou eli- 
minação, para evitar esses problemas quando o modelo 
final é analisado. 


Resumo 

Um dos passos mais importantes, ainda que por vezes seja 
subjetivo, é a operacionalização de construtos. Na tentati- 
va de garantir precisão teórica, muitas vezes os pesquisa- 
dores têm diversas escalas estabelecidas a serem escolhi- 
das, cada uma sendo uma pequena variação das demais. 
Porém, mesmo com o amplo uso de escalas, o pesquisador 
frequentemente se encontra diante da falta de uma escala 
estabelecida e deve desenvolver uma nova ou modificar 
consideravelmente uma existente para o novo contexto. 
Em todas essas situações, o modo como o pesquisador 
seleciona os itens para medir cada construto determina a 
fundamentação de todo o restante da análise SEM. 


Estágio 2: Desenvolvimento e 
especificação do modelo de medida 


Com os itens de escala especificados, a pesquisa agora deve 
especificar o modelo de medição. Neste estágio, cada cons- 
truto latente a ser incluído no modelo é identificado e as 
variáveis indicadoras medidas (itens) são designadas para 
construtos latentes. Apesar de essa identificação e designa- 
ção poderem ser representadas por equações, é mais sim- 
ples representar este processo com um diagrama. O Docu- 
mento 10-2b representa um modelo simples de mensuração 
de dois construtos, com quatro indicadores associados a 
cada construto e uma relação correlacional entre eles. 

Estimação do modelo completo de mensuração envol- 
ve especificação de termos adicionais (ou seja, termos de 
erro para cada indicador). Uma especificação básica pode 
ser ilustrada como se segue: 


O modelo de mensuração simples na Figura 10-7 tem 
um total de 17 parâmetros estimados (isto é, oito car- 
gas estimadas, oito erros estimados e uma estimativa 
de correlação entre construtos). A carga estimada para 
cada seta ligando um construto a uma variável medida 


é uma estimativa da carga de uma variável — o grau em 
que aquele item está relacionado com o construto. Este 
estágio de SEM pode ser imaginado como uma designa- 
ção de variáveis individuais a construtos. Visualmente, 
isso responde a seguinte questão: onde as setas devem 
ser esboçadas para ligar construtos a variáveis? 

Diversos caminhos possíveis não foram especificados 
(p.ex., correlações entre variáveis indicadoras, cargas de 
indicadores em mais de um construto etc.). No processo 
de estimação, essas cargas não-especificadas (um total 
de 19) são consideradas nulas, o que significa que elas 
não serão estimadas. 


A especificação do modelo de mensuração pode ser 
um processo direto, mas diversas questões ainda devem 
ser tratadas. O Capítulo 11 oferece uma discussão mais 
detalhada de cada uma delas. Os tipos de questões são lis- 
tados abaixo: 


1. Podemos empiricamente sustentar a validade e a unidimen- 
sionalidade dos construtos? Pontos essenciais devem ser 
acionados para se estabelecer a base teórica dos construtos 
e mensurações. 

2. Quantos indicadores devem ser usados para cada construto? 
Qual é o número mínimo de indicadores? Há um máximo? 
Quais são as ponderações nas decisões sobre aumento ou 
diminuição no número de indicadores? 

3. As medições devem ser consideradas retratos dos constru- 
tos (o que significa que elas descrevem o construto) ou de- 
vem ser vistas como explicação do construto (tal como com- 
binamos indicadores em um índice)? Cada abordagem traz 
consigo diferentes interpretações sobre o que representa o 
construto. 


O pesquisador, mesmo com escalas bem definidas, 
ainda deve confirmar a validade e a unidimensionalidade 
neste contexto específico. Em qualquer esforço de desen- 
volvimento de escala, questões como o número de indi- 
cadores e o tipo de especificação de construto devem ser 
abordadas. Pesquisadores sempre devem garantir que tais 
questões são completamente examinadas, pois quaisquer 
problemas não-resolvidos neste estágio podem afetar a 
análise inteira, geralmente de maneiras não percebidas. 


Cova 02 


FIGURA 10-7 Representação visual (diagrama de caminhos) de um modelo de mensuração. 


*N. de R.T.: A notação correta das quatro cargas correspondentes ao segundo construto (C2) é: L,,, Lp p, Lap e Lip: 
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Estágio 3: Planejamento de um estudo 
para produzir resultados empíricos 


Com o modelo básico especificado em termos de constru- 
tos e variáveis/indicadores medidos, o pesquisador deve 
voltar a atenção para problemas envolvendo planejamen- 
to de pesquisa e estimação. Os seis problemas abordados 
nesta seção são os seguintes: 


Planejamento de pesquisa 


1. Tipo de dados analisados: covariâncias ou correlações 
2. Dados perdidos 
3. Tamanho amostral 


Estimação de modelo 


4. Estrutura do modelo 
5. Técnicas de estimação 
6. Programa computacional usado 


A SEM tem muitas similaridades com outras técnicas 
multivariadas quanto a essas questões, mas também apre- 
senta algumas considerações únicas. 


Questões de delineamento de pesquisa 

Como acontece com qualquer outra técnica multivariada, 
a SEM requer consideração cuidadosa de fatores que afe- 
tam o planejamento de pesquisa e que são necessários para 
uma análise SEM bem sucedida. Apesar de os aspectos es- 
tatísticos da estimação SEM serem discutidos na próxima 
seção, aqui é importante observar que tamanho da amos- 
tra e dados perdidos podem ter profundo efeito sobre os 
resultados, não importando qual o método empregado. 
Além disso, a SEM pode ser estimada com covariâncias 
ou correlações. Assim, o pesquisador deve escolher o tipo 
apropriado de matriz de dados para a questão de pesquisa 
que é tratada. Essas três questões são discutidas na próxi- 
ma seção. 


Covariância versus correlação. Pesquisadores usuários 
de análises SEM no passado debateram sobre o uso de 
matriz de covariância versus correlação como entrada. A 
SEM foi originalmente desenvolvida usando-se matrizes 
de covariância (por isso é conhecida pelo nome comum de 
análise de estruturas de covariância). Muitos pesquisadores 
defenderam o emprego de correlações como uma forma 
mais simples de análise que era mais fácil de interpretar. A 
questão era também mais central para o planejamento da 
pesquisa quando as matrizes de entrada eram geralmente 
computadas usando-se alguma outra rotina estatística fora 
do programa SEM. Era necessária uma escolha para calcu- 
lar e dar entrada à matriz apropriada. Hoje em dia, a maio- 
ria dos programas SEM pode computar uma solução para 
o modelo a partir dos dados originais sem que o pesqui- 
sador calcule uma matriz de correlação ou de covariância 
em separado. Agora os pesquisadores devem considerar a 
escolha de correlações ou covariâncias baseados principal- 
mente em aspectos interpretativos e estatísticos. 


Interpretação. A grande vantagem da entrada de 
correlações para a SEM decorre do fato de que as esti- 
mativas paramétricas resultantes são por definição prévia 
padronizadas, o que significa que não são dependentes de 
escala. Todos os valores estimados devem estar no inter- 
valo de —1,0 a +1,0, tornando a identificação de estima- 
tivas inadequadas mais fácil do que com covariâncias, as 
quais não apresentam um intervalo definido. Contudo, é 
simples produzir esses resultados a partir de uma entrada 
de covariâncias, requisitando-se uma solução completa- 
mente padronizada. Dessa maneira, correlações não têm 
qualquer vantagem real sobre os resultados padronizados 
obtidos com o uso de covariâncias. 


Impacto estatístico. As principais vantagens no em- 
prego de covariâncias surgem de considerações de caráter 
estatístico. Primeiro, o uso de correlações como entrada 
pode às vezes conduzir a erros nos cálculos do erro pa- 
drão [9]. Além disso, toda vez que hipóteses se referem 
a questões relacionadas com a escala ou a magnitude de 
valores (p.ex., comparação de médias), então covariâncias 
devem ser usadas porque esta informação não é retida 
usando-se correlações. Finalmente, qualquer comparação 
entre amostras exige que covariâncias sejam usadas como 
dados de entrada. Assim, covariâncias têm vantagens dis- 
tintas em termos de suas propriedades estatísticas versus 
correlações. 


Resumo. Ao se comparar o emprego de correlações 
com o de covariâncias, recomendamos o de covariâncias 
sempre que possível. Programas de computador, hoje 
em dia, tornam a seleção de uma opção em vez de outra 
apenas uma questão de escolha do tipo de dados a serem 
computados a partir do menu apropriado [25]. Matrizes 
de covariância oferecem ao pesquisador uma flexibilidade 
muito maior, devido ao conteúdo de informação relativa- 
mente maior que elas contêm. 


Dados perdidos. Exatamente como em outros procedi- 
mentos multivariados, o pesquisador deve tomar diversas 
decisões importantes referentes a dados perdidos. Duas 
questões devem ser respondidas no que diz respeito a da- 
dos perdidos, para que se trate adequadamente de qual- 
quer problema que isso possa criar: 


1. Os dados perdidos são suficientes e não-aleatórios a pon- 
to de provocarem problemas de estimação ou interpreta- 
ção? 

2. Se dados perdidos devem ser corrigidos, qual é a melhor 
abordagem? 


Discutiremos os aspectos que se relacionam especifi- 
camente com SEM e dados perdidos na próxima seção. 
O leitor deve também rever o Capítulo 2, no qual é dada 
uma discussão mais completa sobre cada técnica e os mé- 
todos de avaliação da extensão e do padrão de dados per- 
didos. 
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Extensão e padrão de dados perdidos. Notavel- 
mente, dados perdidos sempre devem ser corrigidos se 
seguirem um padrão não-aleatório ou se mais de 10% 
dos itens de dados estão faltando. Dados perdidos são 
considerados como completamente perdidos ao acaso 
(MCAR) se o padrão de dados perdidos para uma variá- 
vel não depender de qualquer outra variável no conjunto 
de dados ou dos valores da variável em si [40]. Se o pa- 
drão de dados perdidos para uma variável se relaciona 
com outras variáveis, mas não com seus próprios valores, 
então ele é considerado como sendo perdido ao acaso 
(MAR). Novamente, o Capítulo 2 oferece uma discus- 
são muito mais detalhada sobre os procedimentos em- 
pregados na avaliação da extensão e do padrão de dados 
perdidos. 


Ações corretivas em dados perdidos. Três métodos 
básicos estão disponíveis para resolver o problema de da- 
dos perdidos: a abordagem de caso completo (conhecida 
como eliminação por lista), a abordagem totalmente dis- 
ponível (conhecida como eliminação aos pares) e as técni- 
cas de atribuição baseadas em modelos. Tradicionalmen- 
te, eliminação por lista era considerada mais apropriada 
para SEM. Mais recentemente, a eliminação aos pares, 
que permite o uso de mais dados, tem sido aplicada. Am- 
bos os procedimentos podem gerar problemas [1]. 

Como resultado, programas SEM introduziram uma 
forma de atribuição geralmente conhecida como aborda- 
gens baseadas em modelos. Elas estendem a técnica mais 
comum de substituição pela média no sentido de que da- 
dos perdidos são atribuídos (substituídos) com base em 
todos os dados disponíveis para um dado respondente. 
As duas abordagens mais comuns são (1) a estimação de 
máxima verossimilhança dos valores perdidos (ML) e (2) 


o método EM, que estima os valores de cada média e 
covariância como se não houvesse qualquer dado perdi- 
do. Esta abordagem difere no sentido de usar a informa- 
ção não-perdida disponível para um respondente a fim 
de fornecer uma estimativa de máxima verossimilhança 
das médias e covariâncias amostrais (no lugar dos dados 
reais). Uma discussão detalhada desses métodos de atri- 
buição está além de nosso escopo, mas está à disposição 
em várias fontes [13]. 


Escolha de uma abordagem de dados perdi- 
dos. Qual é o melhor método para se lidar com dados 
perdidos para SEM em geral? Quando os dados perdidos 
são aleatórios, são menos que 10% das observações, e as 
cargas fatoriais são relativamente elevadas (0,7 ou mais), 
bons resultados podem ser esperados usando-se qualquer 
uma dessas abordagens de dados perdidos [12]. Contudo, 
em outros casos, a seleção apropriada de um tratamento 
para dados perdidos pode resultar em maior confiança de 
que os resultados são válidos e livres de vieses. O impac- 
to da técnica selecionada sobre convergência de modelo, 
precisão de estimativa de parâmetro e precisão de quali- 
dade de ajuste depende não somente de quanto existe de 
dados perdidos, mas também do verdadeiro tamanho das 
cargas fatoriais e do tamanho da amostra geral [12]. 

A Tabela 10-1 resume as vantagens e desvantagens de 
cada técnica. A abordagem de caso completo (eliminação 
por lista) se torna particularmente problemática quando 
amostras e cargas fatoriais são pequenas. Reciprocamen- 
te, as vantagens das técnicas baseadas em modelos se tor- 
nam evidentes quando tamanhos amostrais e cargas fato- 
riais são geralmente menores. A abordagem totalmente 
disponível (eliminação aos pares) tem muitas boas pro- 
priedades, mas o usuário deve estar ciente da inflação po- 


TABELA 10-1 Algumas vantagens e desvantagens de diferentes métodos de dados perdidos 


Método Vantagens Desvantagens 
Caso completo (lista) e x? mostra pouco viés sob a maioria das e Aumenta a probabilidade de não-convergência (pro- 
condições grama SEM não consegue encontrar uma solução) 
e Tamanho efetivo de amostra é conhecido a menos que cargas fatoriais sejam altas (> 0,6) e 
e Fácil de implementar usando qualquer tamanhos amostrais sejam grandes (> 250) 
programa e Probabilidade aumentada de vieses nas cargas 
fatoriais 
e Probabilidade aumentada de vieses em estimativas 
de relações entre fatores 
Totalmente disponível e Menos problemas com convergência e » sofre viés para cima quando os dados perdidos 
(aos pares) e Estimativas de cargas fatoriais excedem 10%, cargas fatoriais são altas e tama- 
relativamente livres de vieses nhos amostrais são grandes 
e Fácil de implementar usando qualquer e Tamanho amostral efetivo é incerto 
programa e Não tão bem conhecido 
Baseado em modelos e Menos problemas com convergência e Indisponível em programas SEM mais antigos 
(ML/EM) e x mostra pouco viés sob a maioria das e Tamanho amostral efetivo é incerto para EM 


condições 


e Viés mínimo sob condições de dados 


perdidos aleatórios 


Nota: Ver Enders e Bandalos (2001) e Enders e Peugh (2004) para mais detalhes. ML/EM foram combinados com base nas diferenças negligenciá- 


veis entre os resultados para os dois (Enders e Peugh, 2004). 


564 Análise Multivariada de Dados 


tencial de estatísticas de ajuste quando uma quantia mo- 
desta ou grande de dados está faltando e cargas fatoriais 
são grandes. 

Uma consideração final na seleção de uma técnica é 
a especificação do tamanho da amostra. As técnicas de 
abordagem totalmente disponível (aos pares) e baseada 
em modelos complicam a especificação do tamanho amos- 
tral, uma vez que elas potencialmente utilizam diferentes 
tamanhos de amostra para cada termo de covariância. No 
entanto, o pesquisador pode apenas especificar um tama- 
nho geral (N) usado nos cálculos de ajuste geral e de erros 
padrão de parâmetros. Usando PD para ilustrar, o pesqui- 
sador não pode mais identificar um só tamanho amostral, 
pois o N para a covariância entre duas variáveis quaisquer 
é possivelmente diferente do N para a covariância entre 
duas variáveis distintas. Pesquisadores SEM investigaram 
os variados efeitos de se estabelecer N como o tamanho 
da amostra completa (o maior número de observações), o 
tamanho médio da amostra e o tamanho mínimo da mes- 
ma (o menor N associado com qualquer covariância amos- 
tral). Esses resultados geralmente sugerem que a inserção 
do tamanho mínimo conduz aos menores problemas com 
convergência, viés de ajuste e viés de estimativas paramé- 
tricas [8, 13]. 

Resumindo, quando o tamanho amostral excede 250 e 
a quantia total de dados perdidos envolvidos entre as va- 
riáveis medidas está abaixo de 10%, então a abordagem 
totalmente disponível (aos pares) é uma boa solução para 
o problema de perda de dados. Com este método, o tama- 
nho da amostra (N) deve ser estabelecido como o tamanho 
mínimo (o menor) disponível para quaisquer duas covari- 
âncias. Com amostras pequenas e quando a quantia de da- 
dos perdidos se torna grande, então as abordagens basea- 
das em modelos (EM/ML) se tornam uma opção superior. 
No entanto, deve-se ter cuidado ao se extrair conclusões a 
partir de qualquer amostra que contenha grandes quanti- 
dades de dados perdidos. 


Tamanho amostral. Em geral, a SEM requer uma 
amostra maior em comparação com outras técnicas mul- 
tivariadas. Alguns dos algoritmos estatísticos usados por 
programas SEM não são confiáveis com amostras peque- 
nas. Tamanho amostral, como em qualquer outro método 
estatístico, fornece uma base para a estimação de erro de 
amostragem. Como ponto de partida para a discussão de 
tamanho amostral em SEM, o leitor pode rever as discus- 
sões sobre tamanhos exigidos para análise fatorial explo- 
ratória (Capítulo 3). Sabendo-se que amostras maiores 
geralmente demandam mais tempo e são mais caras de se 
obter, a questão crítica em SEM envolve o quão grande 
uma amostra deve ser para produzir resultados confiáveis. 

Opiniões referentes a tamanhos mínimos de amostras 
têm variado [28,29]. Diretrizes propostas variam com pro- 
cedimentos de análises e características de modelos. Cinco 
considerações que afetam o tamanho exigido para amostra 
em SEM incluem as seguintes: 


« Distribuição multivariada de dados 

« Técnica de estimação 

Complexidade do modelo 

» Quantia de dados perdidos 

- Quantia de variância média de erro entre os indicadores re- 
flexivos 


NEN 


Cada uma dessas considerações é tratada nos próximos 
parágrafos. 


Distribuição multivariada. À medida que os dados 
se desviam mais da suposição de normalidade multivaria- 
da, a proporção de respondentes em relação a parâmetros 
precisa ser maior. Uma proporção geralmente aceita para 
minimizar problemas com os desvios da normalidade é de 
15 respondentes para cada parâmetro estimado no modelo. 
Apesar de alguns procedimentos de estimação serem espe- 
cificamente projetados para lidar com dados não normais, 
o pesquisador sempre é encorajado a fornecer tamanho 
amostral suficiente para permitir que o impacto do erro 
amostral seja minimizado, especialmente para dados não- 
normais [46]. 


Técnica de estimação. O procedimento de estimação 
SEM mais comum é a estimação de máxima verossimilhan- 
ca (MLE). É sabido que ela fornece resultados válidos com 
tamanhos amostrais tão pequenos quanto 50, mas os tama- 
nhos mínimos recomendados para garantir soluções MLE 
estáveis são de 100 a 150. MLE é uma abordagem iterativa 
que torna mais provável que amostras pequenas produzam 
resultados inválidos. Um tamanho amostral recomenda- 
do é 200, o que fornece uma base sólida para estimação. 
Deve ser observado que à medida que o tamanho amos- 
tral se torna grande (>400), o método fica mais sensível e 
praticamente qualquer diferença é detectada, fazendo com 
que as medidas de qualidade de ajuste sugiram ajuste ruim 
[43]. Como resultado, tamanhos amostrais entre 150 e 400 
são sugeridos, sujeitos às outras considerações discutidas a 
seguir. 


Complexidade do modelo. Modelos mais simples po- 
dem ser testados com amostras menores. De forma mais 
simples, mais variáveis medidas ou indicadoras exigem 
amostras maiores. Não obstante, modelos podem ser com- 
plexos em outras situações a ponto de todas exigirem tama- 
nhos amostrais maiores: 


e Modelos com mais construtos que exigem mais parâmetros a 
serem estimados 

e Modelos SEM com construtos que têm menos de três variá- 
veis medidas/indicadoras 

e Análises multigrupo que demandam uma amostra adequada 
para cada grupo 


O papel do tamanho da amostra é produzir mais infor- 
mação e maior estabilidade, o que auxilia o pesquisador 
na execução da SEM. Uma vez que um pesquisador tenha 
excedido o tamanho absoluto mínimo (uma observação a 
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mais do que o número de covariâncias observadas), amos- 
tras maiores significam menor variabilidade e maior estabi- 
lidade nas soluções. Assim, a complexidade do modelo em 
SEM conduz à necessidade por amostras maiores. 


Dados perdidos. Dados perdidos complicam o tes- 
te de modelos SEM e o uso de SEM em geral, porque na 
maioria das abordagens para se corrigir dados perdidos o 
tamanho da amostra é reduzido em algum grau a partir 
do número original de casos. Dependendo da técnica de 
dados perdidos considerada e da extensão antecipada dos 
mesmos e até dos tipos de questões sendo tratadas, o que 
pode incluir maiores níveis de dados perdidos, o pesquisa- 
dor deve planejar um aumento no tamanho amostral para 
compensar quaisquer problemas de dados perdidos. 


Variância média de erro de indicadores. Pesquisas 
recentes indicam que o conceito de comunalidade (ver 
Capítulo 3 para mais detalhes) é uma forma mais relevan- 
te de abordar a questão do tamanho amostral. Comunali- 
dades representam a quantia média de variação entre as 
variáveis medidas/indicadoras explicada pelo modelo de 
medição. Comunalidades podem ser diretamente calcula- 
das a partir de cargas de construtos (ver Capítulo 11). Es- 
tudos mostram que amostras maiores são exigidas quando 
comunalidades ficam menores (ou seja, os construtos não- 
observados não estão explicando tanta variância nos itens 
medidos). Modelos contendo múltiplos construtos com 
comunalidades menores que 0,5 (ou seja, estimativas de 
cargas padronizadas menores que 0,7) também requerem 
tamanhos maiores para convergência e estabilidade de 
modelo [12]. O problema é exagerado quando modelos 
têm um ou dois fatores. 


Resumo sobre tamanho amostral. À medida que a 
SEM amadurece e pesquisa adicional sobre questões rele- 
vantes a respeito de delineamento de pesquisa é realizada, 
diretrizes prévias como “sempre maximize seu tamanho 
amostral” e “amostras de 300 são exigidas” não são mais 
apropriadas. Ainda é verdade que amostras maiores geral- 
mente produzem soluções mais estáveis que são mais pro- 
váveis de serem replicadas, mas foi mostrado que decisões 
referentes a tamanho amostral devem ser tomadas com 
base em um conjunto de fatores. 

Baseadas na discussão sobre tamanho de amostra, as 
sugestões a seguir são oferecidas com base na complexida- 
de do modelo e nas características fundamentais do mode- 
lo de mensuração: 


e Modelos SEM contendo cinco construtos ou menos, cada 
um com mais de três itens (variáveis observadas) e com co- 
munalidades elevadas (0,6 ou mais), podem ser adequada- 
mente estimados com amostras tão pequenas quanto as de 
100-150. 

e Se alguma comunalidade for modesta (0,45-0,55), ou se o 
modelo contém construtos com menos de três itens, então o 
tamanho exigido para a amostra é da ordem de 200. 


e Se as comunalidades forem inferiores ou se o modelo incluir 
múltiplos construtos subidentificados (menos que 3 itens), 
então tamanhos amostrais mínimos de 300 ou mais são ne- 
cessários para que sejamos capazes de recuperar parâme- 
tros da população. 

e Quando o número de fatores for maior que seis, sendo que 
alguns deles usam menos de três itens medidos como indica- 
dores e múltiplas comunalidades baixas estão presentes, as 
exigências referentes a tamanho de amostra podem exceder 
500. 


Além dessas características do modelo a ser estimado, 
o tamanho amostral deve ser aumentado nas seguintes 
circunstâncias: 


e Dados exibem características não-normais 
e Certos procedimentos alternativos de estimação são usados 
e Espera-se mais de 10% de dados perdidos 


Para garantir uma solução precisa, o pesquisador ago- 
ra deve considerar vários fatores potenciais que podem 
influenciar aumentos no tamanho amostral em diretrizes 
mais gerais. 


Resumo das questões sobre delineamento de pesqui- 
sa. Ao se planejar uma análise SEM, o pesquisador 
deve abordar questões enfrentadas por todas as técni- 
cas multivariadas: tipos de dados a serem analisados, 
o impacto de dados perdidos, e o tamanho de amostra 
exigido para se atender as metas de pesquisa. A carac- 
terística ímpar da análise SEM concentradas sobre a 
matriz de covariância, no lugar das observações indi- 
viduais, demanda alguns ajustes em nossas orientações 
anteriores sobre tais questões. No entanto, independen- 
temente dos ajustes, o impacto potencial de tais fatores 
é tão crítico em SEM quanto em qualquer outra técnica 
multivariada. 


Questões sobre estimação de modelo 

Além dos aspectos mais gerais sobre planejamento de 
pesquisa discutidos na seção anterior, a análise SEM tem 
também diversas características únicas. Essas característi- 
cas se relacionam com a estrutura do modelo, a técnica de 
estimação empregada e o programa de computador sele- 
cionado para a análise. 


Estrutura do modelo. O passo mais importante para se 
estabelecer uma análise SEM é a determinação e a comu- 
nicação da estrutura do modelo teórico para o progra- 
ma. Diagramas de caminhos como aqueles utilizados em 
exemplos anteriores podem ser úteis para este fim. Co- 
nhecendo a estrutura do modelo teórico, o pesquisador 
pode então especificar os parâmetros a serem estimados. 
Esses modelos frequentemente incluem abreviações SEM 
comuns que denotam o tipo de relação ou variável referi- 
da. O Apêndice 10B inclui um guia para essas abreviações 
comuns. 

Apesar de a especificação de fatores livres e fixos ser 
relativamente simples, tal tarefa é uma diferença crítica 
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entre a SEM e muitas outras técnicas multivariadas. Um 
parâmetro livre é um que deve ser estimado pela análise 
SEM. Um parâmetro fixo é aquele cujo valor é especificado 
pelo pesquisador. Geralmente um parâmetro fixo recebe o 
valor zero, indicando que nenhuma relação é estimada. A 
SEM requer que cada possível parâmetro seja especificado 
como estimado ou não. Hoje em dia, programas com inter- 
faces gráficas (discutidos em uma seção adiante) permitem 
que o pesquisador facilmente especifique os parâmetros a 
serem estimados, muitas vezes diretamente em um diagra- 
ma de caminhos. No entanto, não importando qual progra- 
ma é usado, o pesquisador deve ser capaz de especificar o 
modelo SEM completo em termos de cada parâmetro a ser 
estimado. 


Técnica de estimação. Logo que o modelo é especificado, 
pesquisadores devem escolher como o modelo será estima- 
do. Em outras palavras, qual algoritmo matemático será 
utilizado para identificar estimativas para cada parâmetro 
livre? Diversas opções estão disponíveis para se obter uma 
solução SEM. 

As primeiras tentativas de estimação de modelo de 
equações estruturais foram realizadas com regressão de 
mínimos quadrados ordinários (OLS). Esses esforços fo- 
ram rapidamente superados pela estimação de máxima 
verossimilhança (MLE), que é mais eficiente e sem vieses 
quando a suposição de normalidade multivariada é aten- 
dida. MLE foi usada nas primeiras versões de LISREL 
e se tornou a técnica mais amplamente empregada na 
maioria dos programas SEM. A sensibilidade potencial 
da MLE para não-normalidade, porém, criou uma neces- 
sidade por técnicas alternativas de estimação. Métodos 
como os mínimos quadrados ponderados (WLS), míni- 
mos quadrados generalizados (GLS), e estimação as- 
sintoticamente livre de distribuição (ADF) se tornaram 
disponíveis [16]. A técnica ADF recebeu particular aten- 
ção devido a sua insensibilidade à não-normalidade dos 
dados. Sua principal desvantagem é o tamanho amostral 
maior exigido. 

Todas as técnicas alternativas de estimação se populari- 
zaram à medida que os computadores pessoais tornaram-se 
mais potentes, tornando-as úteis para problemas típicos. A 
MLE continua sendo a técnica mais empregada e é a opção 
padrão na maioria dos programas SEM. Na verdade, ela 
tem se mostrado bastante robusta diante de violações da 
suposição de normalidade. Pesquisadores compararam a 
MLE com outras técnicas e ela produziu resultados confiá- 
veis sob muitas circunstâncias [35, 36]. 


Programas de computador. Diversos programas estatísti- 
cos prontamente disponíveis são convenientes para execu- 
tar SEM. Tradicionalmente, o programa mais usado é LIS- 
REL (LInear Structural RELations) [7, 25], um programa 
flexível que pode ser aplicado em muitas situações (ou seja, 
estudos cross-section, experimentais, quase-experimentais 


e longitudinais). Pesquisadores de muitas áreas de estudo 
têm aplicado SEM usando LISREL, e isso se tornou qua- 
se sinônimo de modelagem de equações estruturais. EOS 
(uma abreviação para equações) é outro programa ampla- 
mente usado que também pode executar regressão, análise 
fatorial e testar modelos estruturais [4]. AMOS (Análise de 
Estruturas de Momento) é um terceiro programa que tem 
conquistado popularidade por ser amigável e disponível 
como uma adição ao SPSS. AMOS também esteve entre os 
primeiros programas SEM a simplificar a interface de modo 
que um pesquisador poderia executar uma análise sem ter 
que escrever qualquer código computacional. Finalmente, 
CALIS é um programa SEM disponível com SAS. 

Em última instância, a escolha de um programa SEM 
é baseada na preferência do pesquisador e na disponibili- 
dade. Os programas estão, na verdade, se tornando mais 
parecidos à medida que evoluem. AMOS, EQS e LISREL 
estão disponíveis com interfaces do tipo “aponte-e-clique”. 
Cada um deles tem também uma interface gráfica que per- 
mite ao pesquisador modificar o programa com um diagra- 
ma de caminhos interativo. O que muda de programa para 
programa é a notação. LISREL usa letras gregas para re- 
presentar fatores latentes, termos de erro e estimativas de 
parâmetros, e letras latinas (x e y) para representar variá- 
veis observadas. Esta notação fornece uma abreviação con- 
veniente para a descrição de modelos e a comunicação com 
o programa. Esta tem se tornado a abreviação mais comum 
para SEM, a qual simplifica consideravelmente discussões 
uma vez que o usuário se familiariza com ela. 

Os outros programas apóiam-se menos em abreviações 
gregas e usam mais outras notações, como distinções entre 
letras latinas maiúsculas e minúsculas ou diferentes cores 
para descrever diferentes tipos de variável e relação. Ape- 
sar de o poder computacional ter sido uma questão, hoje 
em dia todos esses programas estão disponíveis em versões 
que são processadas facilmente praticamente em qualquer 
computador pessoal. Para a maioria das aplicações padrão, 
esses programas devem produzir resultados substantivos 
semelhantes. Um apêndice no final do Capítulo 11 ilustra 
essa aplicação com mais detalhes. 


Resumo das questões sobre estimação. Os aspectos ím- 
pares encontrados na análise SEM já foram problemáticos 
para o pesquisador iniciante, mas os avanços em algorit- 
mos estatísticos e programas de computador oferecem não 
apenas uma gama maior de opções de estimação para se 
lidar com várias condições nos dados de entrada, mas tam- 
bém melhoram a interface entre pesquisador e programa. 
O pesquisador atual dispõe de uma miríade de opções de 
análise em qualquer um dos pacotes computacionais que 
podem tratar de qualquer questão de pesquisa apropriada 
para uma análise SEM. Assim, pesquisadores devem ser 
vigilantes em não permitir que as facilidades de uso dos 
softwares substituam o julgamento teórico e o controle do 
pesquisador, os quais são essenciais em SEM. 
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REGRAS PRÁTICAS 10-2 


Estágios 1-3 de SEM 


Quando um modelo tem escalas inspiradas em várias fontes 
relativas a outras pesquisas, recomenda-se um pré-teste 
usando respondentes semelhantes àqueles da população a 
ser estudada, para examinar itens quanto a adequação 
Eliminação aos pares de casos perdidos (abordagem 
totalmente disponível) é uma boa alternativa para se lidar 
com dados perdidos quando a quantia destes é inferior a 
10% e o tamanho amostral gira em torno de 250 ou mais 
e Quando os tamanhos amostrais se tornam pequenos 
ou quando os dados perdidos excedem 10%, um dos 
métodos de atribuição para dados perdidos passa a ser 
uma boa alternativa para se lidar com dados perdidos 
Quando a quantia de dados perdidos fica muito elevada 
(15% ou mais), a SEM pode não ser adequada 
A matriz de covariância observada da amostra (S) pode 
ser representada por uma matriz de covariância ou de 
correlação 
Matrizes de covariância fornecem ao pesquisador uma 
maior flexibilidade decorrente do conteúdo informativo 
relativamente maior que elas contêm e são a forma 
recomendada de entrada para modelos SEM 
O tamanho mínimo de amostra para um modelo SEM 
em particular depende de vários fatores, incluindo a 
complexidade do modelo e as comunalidades (variância 


média extraída entre itens) em cada fator: 


e Modelos SEM contendo cinco ou menos construtos, 
cada um com mais de três itens (variáveis observadas) e 
com elevadas comunalidades (0,6 ou mais), podem ser 
adequadamente estimados com amostras tão pequenas 
quanto 100-150 
Quando o número de fatores é maior que seis, sendo 
que alguns deles têm menos que três itens medidos 
como indicadores, e múltiplas comunalidades baixas 
estão presentes, as exigências de tamanho amostral 
podem exceder 500 


Estágio 4: Avaliação da validade 
do modelo de medida 


Com o modelo de mensuração especificado, dados sufi- 
cientes coletados e decisões importantes já tomadas, como 
a técnica de estimação, o pesquisador chega ao evento 
mais fundamental do teste de SEM: “O modelo de men- 
suração é válido?”. Validade de modelo de mensuração 
depende da qualidade de ajuste para o mesmo e evidência 
específica de validade de construto. 

Qualidade de ajuste (GOF) indica o quão bem o mode- 
lo especificado reproduz a matriz de covariância entre os 
itens indicadores (ou seja, a similaridade entre as matrizes 
de covariância estimada e observada). Desde a primeira 
vez que a medida GOF foi desenvolvida, pesquisadores 


têm procurado refinar e desenvolver novas medidas que 
reflitam várias facetas da habilidade do modelo para re- 
presentar os dados. Dessa forma, diversas medidas alter- 
nativas de GOF estão à disposição do pesquisador. Cada 
medida GOF é única, mas as medições são classificadas 
em três grupos gerais: medidas absolutas, medidas incre- 
mentais e medidas de ajuste de parcimônia. Nas seções a 
seguir, primeiramente revemos alguns elementos básicos 
para o cálculo da medida GOF, seguindo para discussões 
de cada classe de medidas GOF. Leitores interessados em 
discussões mais detalhadas e de caráter estatístico devem 
consultar o Apêndice 10C, que dá uma cobertura mais 
aprofundada sobre muitas das medidas de GOF. 


O básico sobre qualidade de ajuste 

Sempre que a teoria de um pesquisador é usada para es- 
pecificar um modelo a partir do qual os parâmetros são 
estimados, o ajuste do modelo compara a teoria com a 
realidade representada pelos dados. Se a teoria de um 
pesquisador fosse perfeita, a matriz de covariância esti- 
mada (X,) e a matriz de covariância observada (S) seriam 
iguais. Assim, a matriz de covariância estimada é mate- 
maticamente comparada com a matriz de covariância 
observada para se fornecer uma estimativa do ajuste do 
modelo. Quanto mais próximos os valores dessas duas 
matrizes uns em relação aos outros, melhor é o ajuste do 
modelo. 

Discutimos a medida fundamental de ajuste, qui-qua- 
drado (x), e como a mesma quantifica as diferenças entre 
ambas as matrizes. Em seguida, a discussão se concentra 
no cálculo dos graus de liberdade, e finalmente em como 
inferência estatística é afetada pelo tamanho da amostra 
e pelo o ímpeto que disponibiliza medidas alternativas de 
GOF. 


GOF de qui-quadrado (x). A diferença nas matrizes 
de covariância (S — X,) é o valor-chave na avaliação de 
GOF de qualquer modelo SEM. Procedimentos de esti- 
mação SEM, como o de máxima verossimilhança, pro- 
duzem estimativas paramétricas que matematicamente 
minimizam esta diferença para um modelo especificado. 
Um teste qui-quadrado (x) fornece um teste estatístico 
da diferença resultante. Ele é formalmente representado 
pela equação a seguir: 


x = (N — 1)(Matriz de covariância amostral observada — Matriz 
de covariância estimada SEM) 


ou 
X=(N-IXS-2,) 


N é o tamanho da amostra geral. Deve ser observado 
que mesmo quando as diferenças nas matrizes de covariân- 
cia se mantêm constantes, o valor x aumenta quando a 
amostra também aumenta. Analogamente, a matriz de 
covariância estimada SEM é influenciada pelo número 
de parâmetros livres para serem estimados (o k em X,), e 
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assim os graus de liberdade do modelo também influen- 
ciam o teste GOF de x”. 


Graus de liberdade (df). Como em outros procedimen- 
tos estatísticos, graus de liberdade representam a quan- 
tia de informação matemática disponível para estimar 
parâmetros do modelo. Comecemos com uma revisão 
de como isso é calculado e, em seguida, coloquemos isso 
em palavras. O número de graus de liberdade para uma 
análise de um modelo de estrutura de covariância (SEM) 
é determinado por 


dr=(pXp+J-k 


onde p é o número total de variáveis observadas e k é 
o número de parâmetros estimados (livres). A diferença 
em comparação com os cálculos de graus de liberdade 
discutidos em capítulos anteriores é que eles são basea- 
dos no número de observações para as variáveis envolvi- 
das (p.ex., em regressão, df é o tamanho da amostra me- 
nos o número de coeficientes estimados), enquanto que 
o cálculo SEM se baseia no número de covariâncias úni- 
cas e variâncias na matriz de covariância observada. Na 
equação anterior, 1/2[(p)(p + 1)] representa o número 
de termos de covariância abaixo da diagonal somado às 
variâncias sobre a diagonal. Uma implicação importante 
é que tamanho amostral não afeta os graus de liberda- 
de, e veremos adiante como isso influencia o emprego de 
qui-quadrado como medida de GOF. 


Significância estatística de x”. A hipótese nula implica- 
da de SEM é que as matrizes de covariância observadas 
na amostra e estimada por SEM são iguais, o que signi- 
fica que o modelo se ajusta perfeitamente. Sabendo-se 
que o ajuste perfeito não é o caso, o valor x” aumenta. 
Como os valores críticos da distribuição x são conhe- 
cidos, pode ser determinada a probabilidade de que 
qualquer matriz de covarância observada na amostra e a 
estimada por SEM sejam realmente iguais em uma dada 
população. Tal probabilidade é o tradicional valor-p 
associado com testes estatísticos paramétricos. Progra- 
mas SEM fornecem tanto o valor x computado quanto 
o valor-p, de forma que o usuário não tem que realizar 
este cálculo. 

Em capítulos precedentes queríamos tipicamente va- 
lores-p menores (abaixo de 0,05) para mostrar que uma 
relação existia. Com o teste GOF de x” em SEM, quanto 
menor o valor-p, maior a chance de que as matrizes de co- 
variância observada na amostra e estimada por SEM não 
sejam iguais. Logo, com SEM não queremos que o valor-p 
para o teste x seja pequeno (estatisticamente significan- 
te). Ao invés disso, se nossa teoria for sustentada por este 
teste, queremos um valor pequeno para x (e um corres- 
pondente valor-p grande) que indica nenhuma diferença 
estatisticamente significante entre as matrizes. 


Resumo. Qui-quadrado (x) é a medida fundamental usa- 
da em SEM para quantificar diferenças entre as matrizes 
de covariância observada e estimada. No entanto, a real 
avaliação de GOF com um só valor x é complicada por 
diversos fatores discutidos na próxima seção. Para oferecer 
perspectivas alternativas de ajuste do modelo, pesquisado- 
res desenvolveram diversas novas medidas de qualidade de 
ajuste. As discussões a seguir apresentam o papel do qui- 
quadrado, bem como das medidas alternativas. 


Medidas de ajuste absoluto 


Índices de ajuste absoluto são uma medida direta de 
quão bem o modelo especificado pelo pesquisador repro- 
duz os dados observados [26]. Como tais, eles fornecem a 
avaliação mais básica de quão bem a teoria de um pesqui- 
sador se ajusta aos dados da amostra. Eles não comparam 
explicitamente a GOF de um modelo especificado com a 
de qualquer outro modelo. Em vez disso, cada modelo é 
avaliado independentemente de outros possíveis modelos. 


Estatística x. O índice de ajuste absoluto mais funda- 
mental é a estatística x”. Ela é também a única medida de 
ajuste SEM com caráter estatístico [7]. Fundamentalmente, 
ela é a mesma estatística x usada em classificação cruzada 
para examinar se existe uma relação entre duas medidas 
não-métricas. A diferença crucial, porém, é que em SEM 
o pesquisador está procurando por semelhanças entre ma- 
trizes (ou seja, valores baixos de x”) para sustentar o mode- 
lo como representativo dos dados. No entanto, em muitas 
outras aplicações (como classificação cruzada) que usam 
uma estatística x, o pesquisador procura por diferenças 
(ou seja, valores grandes de x”) para sustentar uma relação 
entre as medidas não-métricas. 

A estatística GOF de x apresenta duas proprieda- 
des matemáticas que são problemáticas em seu emprego 
como medida GOF. Primeiro, lembre-se que a estatística 
x é uma função matemática que depende do tamanho da 
amostra (N) e da diferença entre as matrizes de covariância 
observada e estimada. À medida que N aumenta, o mesmo 
acontece com o valor x, mesmo quando as diferenças en- 
tre as matrizes são idênticas. Em segundo lugar, apesar de 
isso talvez não parecer tão óbvio, a estatística x pode ficar 
maior quando o número de variáveis observadas aumenta. 
Desse modo, ainda que se mantenha tudo igual, o simples 
acréscimo de indicadores a um modelo faz com que os va- 
lores x fiquem maiores. 

Apesar de o teste x ser intuitivamente satisfatório e 
poder fornecer um teste de significância estatística, essas 
propriedades matemáticas apresentam, às vezes, proble- 
mas desagradáveis. Alguém poderia argumentar que o ta- 
manho da amostra não deveria influenciar no ajuste de um 
modelo SEM. Na verdade, recomendamos anteriormente 
amostras maiores. Poder-se-ia argumentar também que 
se mais variáveis são necessárias para representar a reali- 
dade, então elas deveriam corresponder a um ajuste me- 
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lhor, e não pior, desde que elas produzissem medidas váli- 
das. Assim, de algum modo as propriedades matemáticas 
do teste GOF de x reduzem o ajuste de um modelo por 
motivos que podem não ser verdadeiramente prejudiciais 
à sua validade geral. 

Por esta razão, o teste GOF de x” é difícil de usar como 
o único indicador de ajuste de SEM. Pesquisadores de- 
senvolveram muitas medidas alternativas de ajuste para 
corrigir o viés devido a grandes amostras e crescente com- 
plexidade do modelo. Diversos desses índices GOF são 
apresentados a seguir. Contudo, o problema afeta muitos 
desses índices, particularmente alguns dos índices de ajus- 
te absoluto. Dito isso, o valor x para um modelo resume 
bem o ajuste de um modelo, e, com experiência, o pesqui- 
sador pode fazer julgamentos ponderados sobre modelos 
com base neste resultado. Em suma, o teste estatístico ou 
o valor-p resultante é menos significativo quando o tama- 
nho amostral fica grande ou quando o número de variá- 
veis observadas se torna maior. 


Índice de qualidade de ajuste (GFI). O GFI foi uma pri- 
meira tentativa de produzir uma estatística de ajuste que 
fosse menos sensível a tamanho amostral. Ainda que N 
não seja incluído na fórmula, esta estatística continua in- 
diretamente sensível ao tamanho da amostra por conta do 
efeito de N sobre distribuições amostrais [30]. O intervalo 
possível de valores GFI é de O a 1, com valores maiores 
indicando melhor ajuste. No passado, valores GFI maio- 
res que 0,9 eram geralmente considerados bons. Outros 
argumentam que 0,95 deveria ser usado [18]. Retornamos 
adiante com mais detalhes sobre valores bons e ruins de 
ajuste. O Apêndice 10€ contém um pouco mais de deta- 
lhes sobre o GFI e outros índices de ajuste. 

Um índice ajustado de qualidade de ajuste (AGFI) 
tenta levar em conta diferentes graus de complexidade 
do modelo. Ele faz isso ajustando GFI por uma propor- 
ção entre os graus de liberdade usados em um modelo e o 
número total de graus de liberdade disponíveis. O AGFI 
penaliza modelos mais complexos e favorece aqueles com 
um número mínimo de caminhos livres. Valores AGFI 
são tipicamente menores do que valores GFI em propor- 
ção à complexidade do modelo. Nenhum teste estatísti- 
co é associado com GFI ou AGFI, apenas orientações de 
ajuste [44]. 


Raiz do resíduo quadrático médio (RMSR) e raiz padro- 
nizada do resíduo médio (SRMR). Se pensamos em 
cada termo de covariância ou variância como um valor 
individual que será previsto, então podemos imaginar o 
ajuste como o quão precisamente cada termo é previsto. 
O erro de previsão para cada termo de covariância cria 
um resíduo. A raiz do resíduo quadrático médio (RMSR) 
é a raiz quadrada da média dos resíduos quadrados: uma 
média dos resíduos entre termos individuais observados e 
estimados de covariância e variância. Quando covariân- 
cias são empregadas como entrada, RMSR é a covariân- 


cia residual média e ainda é expressa em termos do domí- 
nio de escala das medições. É difícil, portanto, comparar 
resultados RMSR de um modelo com o próximo, a menos 
que os resultados sejam padronizados. 

Uma estatística alternativa sustentada em resíduos é 
a raiz padronizada do resíduo médio (SRMR). Trata-se 
de um valor padronizado de RMSR e, assim, é mais útil 
para comparar ajuste ao longo de modelos. A despeito de 
nenhum valor estatístico de referência poder ser estabele- 
cido, o pesquisador pode avaliar a significância prática da 
magnitude do SRMR sob a ótica dos objetivos de pesquisa 
e das covariâncias ou correlações observadas ou reais [2]. 
Valores menores de RMSR e SRMR representam melhor 
ajuste, e valorações mais altas correspondem a ajustes 
piores, o que coloca RMSR e SRMR em uma categoria de 
índices que, às vezes, são conhecidos como medidas de má 
qualidade de ajuste, nas quais altos valores são indicativos 
de ajuste ruim. 

Resíduos padronizados (SMRSs) são calculados para 
toda covariância possível. SMRSs individuais permitem 
que um pesquisador localize problemas potenciais com 
um modelo de mensuração. O valor SRMR médio é 0, o 
que significa que tanto resíduos positivos quanto negati- 
vos podem ocorrer. Assim, uma covariância prevista me- 
nor que o valor observado resulta em um resíduo positivo, 
enquanto uma covariância prevista maior que a observa- 
da resulta em um resíduo negativo. É difícil estabelecer 
uma regra rígida e rápida que indique quando um resíduo 
é muito grande, mas o pesquisador deve analisar cuidado- 
samente qualquer resíduo padronizado que exceda 14,0] 
(abaixo de —4,0 ou acima de 4,0). 


Raiz do erro quadrático médio de aproximação (RMSEA,). 
Outra medida que tenta corrigir a tendência da estatística 
GOF de y a rejeitar modelos com amostras grandes ou 
grande número de variáveis observadas é a raiz do erro 
quadrático médio de aproximação (RMSEA). Ela difere 
de RMSR no sentido de que tem uma distribuição conhe- 
cida [19]. Assim, ela representa melhor o quão bem um 
modelo se ajusta a uma população e não apenas a uma 
amostra usada para estimação. Ela explicitamente tenta 
corrigir complexidade do modelo e tamanho amostral in- 
cluindo cada um desses dados em sua computação. Valo- 
res RMSEA menores indicam melhor ajuste. Logo, assim 
como SRMR e RMSR, ela é um índice de má qualida- 
de de ajuste, em contraste com índices nos quais valores 
maiores produzem ajuste melhor. 

A questão sobre qual é um “bom” valor RMSEA é 
polêmica, mas valores típicos estão abaixo de 0,10 para a 
maioria dos modelos aceitáveis. Um exame empírico de 
diversas medidas determinou que RMSEA é mais ade- 
quada para uso em estratégias de modelos confirmatórios 
ou concorrentes à medida que amostras se tornam maio- 
res [39]. Amostras grandes podem ser consideradas como 
consistindo de mais de 500 respondentes. Uma vantagem- 
chave de RMSEA é que um intervalo de confiança pode 
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ser construído, fornece o domínio de valores RMSEA 
para um dado nível de confiança. Assim, isso nos permite 
reportar que a RMSEA está entre 0,03 e 0,08, por exem- 
plo, com 95% de confiança. 


Outros índices absolutos. A maioria dos programas 
SEM, hoje em dia, fornece ao usuário muitos índices di- 
ferentes de ajuste. Na discussão precedente, nos concen- 
tramos mais naqueles que são mais comumente usados. 
Nesta seção, tocamos rapidamente em uns poucos outros 
que por vezes são mencionados: 


o X normado: Esta medida GOF é uma proporção simples de 
X com o grau de liberdade para um modelo. Geralmente 
proporções x:df da ordem de 3:1 ou menos são associadas 
com modelos melhor ajustados, exceto em circunstâncias 
envolvendo amostras extremamente grandes (maiores que 
750) ou outras circunstâncias atenuantes, como um elevado 
grau de complexidade do modelo. 

e O índice de validação cruzada esperada (ECVIT) é uma 
aproximação da qualidade de ajuste que o modelo estimado 
atingiria em outra amostra do mesmo tamanho. Baseado na 
matriz de covariância de amostra, ele leva em conta o tama- 
nho amostral real e a diferença que poderia ser esperada 
em outra amostra. O ECVI também leva em consideração 
o número de parâmetros estimados para um dado modelo. 
É mais útil na comparação do desempenho de um modelo 
com outro. 

e O índice de validação cruzada real (CVI) pode ser execu- 
tado usando-se a matriz de covariância computada obtida 
de um modelo em uma amostra para prever a matriz de co- 
variância observada conseguida de uma amostra de valida- 
ção. Dada uma amostra suficientemente grande (ou seja, N 
> 500 para a maioria das aplicações), o pesquisador pode 
criar uma amostra de validação dividindo aleatoriamente as 
observações originais em dois grupos. 

e Gama chapéu também tenta corrigir o tamanho amostral e 
a complexidade do modelo pela inclusão de cada uma des- 
sas informações em seu cálculo. Valores típicos de gama 
chapéu variam entre 0,9 e 1,0. Sua principal vantagem é que 
ele tem uma distribuição conhecida [10]. 


Estes quatro últimos índices são apenas uma amostra 
dos demais índices de ajuste absoluto, e de forma alguma 
correspondem a uma lista exaustiva. Para mais informa- 
ções, o leitor pode consultar a documentação associada 
com o programa SEM específico em uso. 


Índices de ajuste incremental 

Índices de ajuste incremental diferem dos absolutos no 
sentido de que eles avaliam o quão bem um modelo espe- 
cificado se ajusta relativamente a algum modelo alterna- 
tivo de referência. O modelo de referência mais comum 
é chamado de modelo nulo, um que assume que todas as 
variáveis observadas são não-correlacionadas. Isso impli- 
ca que nenhuma redução de dados poderia possivelmente 
melhorar o modelo, pois ele não contém fatores multi- 
itens (ver Capítulo 3), o que tornaria impossível quaisquer 
construtos multi-itens ou relações entre eles. Esta classe 


de índices de ajuste representa a melhora em ajuste pela 
especificação de construtos multi-itens relacionados. 

A maioria dos programas SEM oferece múltiplos índi- 
ces de ajuste incremental como saída padrão. Programas 
diferentes oferecem diferentes estatísticas de ajuste, de 
modo que você pode não encontrar todos eles em uma 
saída SEM em particular. Além disso, à vezes eles são 
chamados de índices de ajuste comparativo, por motivos 
óbvios. 


Índice de ajuste normado (NFD. O NFI é um dos índices 
de ajuste incremental. Ele é uma proporção da diferença 
no valor x para o modelo ajustado e um modelo nulo di- 
vidida pelo valor x para o modelo nulo. Varia entre 0 e 1, 
e um modelo com ajuste perfeito corresponde a um NFI 
de 1. O CFI foi obtido deste índice como um esforço para 
incluir complexidade do modelo em uma medida de ajus- 
te [3]. 


Índice de ajuste comparativo (CFI). O CFI é um índice 
de ajuste incremental que é uma versão melhorada do ín- 
dice de ajuste normado (NFI) [5, 19]. O CFI é normado, 
de forma que seus valores variam entre O e 1, com valores 
mais altos indicando melhor ajuste. Pelo fato do CFI ter 
muitas propriedades desejáveis, incluindo sua insensibi- 
lidade relativa, mas não completa, em relação à comple- 
xidade do modelo, ele está entre os índices mais usados. 
Valores CFI abaixo de 0,90 não são geralmente associados 
com um modelo que se ajusta bem. 


Índice de Tucker Lewis (TLI). O TLI antecede o CFI 
e é conceitualmente semelhante, no sentido de que tam- 
bém envolve uma comparação matemática de um modelo 
teórico de mensuração especificado com um modelo nulo 
de referência [45]. O TLI não é normado, e, assim, seu 
valor pode ficar abaixo de O ou acima de 1. No entanto, 
tipicamente, modelos com bom ajuste têm valores que se 
aproximam de 1, e um modelo com um valor maior sugere 
um ajuste melhor do que o modelo com menor valor. Na 
prática, o TLI e o CFI geralmente fornecem valores muito 
parecidos. 


Índice de não-centralidade relativa (RND. O RNI tam- 
bém compara o ajuste observado resultante do teste de 
um modelo especificado com aquele de um modelo nulo. 
Como os demais índices de ajuste incremental, valores 
maiores representam melhor ajuste, e os valores possíveis 
geralmente variam entre O e 1. RNIs menores que 0,90 
geralmente não são associados com bom ajuste. 


Resumo. Cada estatística de teste incremental apresenta 
suas vantagens e desvantagens. O leitor pode facilmente 
encontrar outros índices de ajuste incremental em dife- 
rentes programas SEM e deve consultar as referências 
desta seção para informações mais detalhadas. Existem 
outros índices de ajuste incremental, mas os que foram 
apresentados aqui correspondem às estatísticas mais apli- 
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cadas [19]. Entre eles, o TLI e o CFI parecem ser os mais 
usados. 


Índices de ajuste de parcimônia 

O terceiro grupo de índices é especificamente planejado 
para fornecer informação sobre qual modelo, em um con- 
junto de modelos concorrentes, é melhor, considerando 
seu ajuste relativo à sua complexidade. Uma medida de 
ajuste de parcimônia é melhorada por um melhor ajuste 
ou por um modelo mais simples. Neste caso, um modelo 
mais simples é aquele com menos caminhos de parâme- 
tros estimados. 

Índices de ajuste de parcimônia são conceitualmente 
parecidos com a noção de um Rº ajustado (discutido no 
Capítulo 4), no sentido de que eles relacionam ajuste do 
modelo com a complexidade do mesmo. Modelos mais 
complexos devem se ajustar melhor aos dados, de forma 
que medidas de ajuste devem ser relativas à complexida- 
de antes que comparações entre modelos possam ser exe- 
cutadas. Os índices não são úteis na avaliação do ajuste 
de um só modelo, mas são muito úteis na comparação do 
ajuste de dois modelos, sendo um mais complexo que o 
outro. 

A razão de parcimônia (PR) de qualquer modelo for- 
ma a base para essas medidas e é calculada como a razão 
entre graus de liberdade usados por um modelo e o total 
disponível de graus de liberdade [31]. Discutimos como 
a razão de parcimônia é usada em cada um dos índices a 
seguir. 


Índice de qualidade de ajuste de parcimônia (PGFD. O 
PGFI ajusta o GFI usando o PR. Teoricamente, os valores 
variam entre O e 1. Assim, dois modelos podem ser com- 
parados e aquele com um PGFI maior é preferível, com 
base na combinação de ajuste e parcimônia representada 
por este índice. Um PGFI tomado sozinho não é um indi- 
cador útil do ajuste de um modelo. Como outros índices 
de ajuste de parcimônia, um valor de PGFI deve ser usado 
somente na comparação com o PGFI de outro modelo. 


Índice de ajuste normado de parcimônia (PNFI). O 
PNFI ajusta o índice de ajuste normado (NFTI) multipli- 
cando-o por PR [34]. Como o PGFI, valores relativamen- 
te elevados representam ajuste relativamente melhor, de 
maneira que ele pode ser usado do mesmo modo que o 
NFI. O PNFI assume algumas das características adicio- 
nais de índices de ajuste incremental relativamente aos 
índices de ajuste absoluto, além de favorecer modelos 
menos complexos. Novamente, os valores do PNFI de- 
vem ser usados na comparação de um modelo com ou- 
tro, sendo que os valores mais altos de PNFI são melhor 
sustentados quanto aos critérios capturados por este ín- 
dice. 


Resumo. O emprego de índices de ajuste de parcimô- 
nia permanece de algum modo controverso. Alguns pes- 


quisadores argumentam que uma comparação de índices 
de ajuste incremental de modelos concorrentes fornece 
evidência similar, e que podemos posteriormente levar 
parcimônia em conta de alguma outra maneira. É óbvio 
dizer que um índice de parcimônia pode fornecer infor- 
mação útil na avaliação de modelos concorrentes, mas 
isso não é o suficiente para se confiar. Quando empre- 
gado, o PNFI é o índice de ajuste de parcimônia mais 
amplamente aplicado. 


Uso de índices de ajuste 

Em última instância, índices de ajuste são utilizados para 
estabelecer a aceitabilidade de um modelo SEM. Prova- 
velmente nenhum outro tópico de SEM é mais discutido 
do que o que constitui um ajuste adequado ou bom. Tal- 
vez a melhor evidência de sua controvérsia seja o núme- 
ro sempre crescente de índices de ajuste disponíveis para 
avaliar a qualidade ou má qualidade de ajuste. Os índices 
já discutidos são apenas uma amostra daqueles comumen- 
te citados em saídas padrão de SEM. 


Problemas associados com o uso de índices de ajus- 
te. A crescente coleta de índices de ajuste e a falta de 
diretrizes consistentes podem ser uma tentação para 
o pesquisador simplesmente escolher um índice que 
forneça a melhor evidência de ajuste em uma análise 
específica e um índice diferente em outra análise. Ob- 
viamente, esta metodologia deve ser evitada. Fazer isso 
requer respostas simples e concisas para duas questões 
importantes: 


1. Qual é a melhor estatística (ou estatísticas) de ajuste para 
objetivamente refletir o ajuste de um modelo? 

2. Quais são os valores objetivos de corte que sugerem bom 
ajuste de modelo para uma dada estatística? 


Infelizmente, as respostas para essas perguntas não 
são simples e nem imediatas. Alguns pesquisadores 
comparam a busca por respostas a tais questões com o 
“mítico Tosão de Ouro, a conquista da fonte da juven- 
tude e a busca pela verdade e beleza absolutas” [32]. De 
fato, muitos problemas são associados com a procura 
pelo bom ajuste. Segue adiante um breve resumo dos 
principais aspectos sobre ajuste de modelos, bem como 
orientações práticas para a interpretação de índices de 
ajuste. 


Problemas com o teste x. Talvez a evidência mais 
clara e convincente de que um ajuste de modelo é adequa- 
do seja um valor x” com um valor-p indicando ausência 
de diferença significante entre as matrizes de covariância 
observada da amostra e a estimada por SEM. Por exem- 
plo, se um pesquisador está satisfeito com a tradicional 
taxa de erro Tipo I de 5%, então um valor-p maior que 
0,05 sugere que o modelo dele reproduziu de maneira efi- 
caz a matriz de covariância das variáveis observadas — um 
“bom” ajuste do modelo. 
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Assim, será que este resultado significa que um valor 
não-significante de x sempre permite que o pesquisador diga 
“caso encerrado”? Não é bem assim. Lembre-se que o valor 
x é influenciado não somente pela diferença entre as matri- 
zes de covariância, mas também pelo tamanho da amostra. 
Além disso, aumentar o tamanho da matriz de covariância 
(isto é, usar mais variáveis indicadoras) aumenta as chances 
de que as diferenças nas matrizes sejam grandes. Como re- 
sultado, o que parece ser um teste estatístico simples e po- 
deroso tem penalidades inerentes para modelos envolvendo 
amostras maiores e mais variáveis indicadoras [3]. Esses fa- 
tores também funcionam no sentido contrário, de modo que 
um modelo simples, particularmente um com uma amostra 
pequena, pode produzir um x não-significante (indicando 
bom ajuste) mas fracassar na exibição de qualquer outra evi- 
dência de validade ou adequação. Assim, o pesquisador não 
deve confiar em apenas uma medida de GOF. 


Valores de corte para índices de ajuste: o mágico 
0,90. O principal objetivo de qualquer um desses índices 
de ajuste é auxiliar o pesquisador na discriminação entre 
modelos especificados aceitáveis e inaceitáveis. A questão 
crucial ainda permanece: o que indica bom ajuste para es- 
ses índices? Periódicos especializados estão repletos com 
resultados SEM que citam um valor de 0,90 para índices im- 
portantes, como TFI, CFI, NFL ou GFI, como indicando um 
modelo aceitável. Alguns podem citar precedentes de um 
artigo previamente publicado. Outras vezes, a regra do 0,90 
é simplesmente citada como uma regra ad hoc razoável sem 
suporte de teoria prévia. Em geral, de alguma forma o 0,90 
se tornou o número mágico para modelos bem ajustados. 

No entanto, pesquisas têm contestado o uso de um só 
valor de corte para esses índices. Os estudos identificaram 
uma série de fatores adicionais que afetam os valores dos 
índices associados com ajuste aceitável: 


e Uma pesquisa que usa dados simulados (para os quais o 
ajuste real é conhecido) oferece contra-argumentos sobre 
esses valores de corte e não apóia o 0,90 como uma regra 
prática geralmente aceitável [19]. Isso demonstra que, por 
vezes, mesmo um índice de qualidade de ajuste incremental 
acima de 0,90 ainda estaria associado a um modelo grave- 
mente mal-especificado. 

e Mais recentemente, outros pesquisadores questionaram o 
emprego de apenas um valor de corte, até mesmo para me- 
didas de ajuste absoluto. Como anteriormente discutido, a 
maioria dos índices GOF compartilha do problema de puni- 
ções injustas de modelos com mais variáveis observadas por 
construto latente [26]. Em contraste, a RMSEA e a SRMR 
realmente fornecem uma vantagem (elas diminuem) quan- 
do um modelo contém mais variáveis. 

e Finalmente, a verdadeira distribuição inerente de dados 
pode influenciar índices de ajuste [14]. Particularmente, à 
medida que os dados se tornam menos apropriados para 
a técnica de estimação selecionada em particular, a habili- 
dade de índices de ajuste refletirem má especificação com 
precisão pode variar. Essa questão parece afetar índices de 
ajuste incremental mais do que os absolutos. 


No final, nenhum valor “mágico” sozinho diferencia 
bons modelos dos ruins para qualquer um desses índices. 
É interessante comparar esses problemas em SEM com 
a falta geral de preocupação para estabelecer um núme- 
ro Rº mágico em regressão múltipla. Se um valor mágico 
mínimo de Rº de 0,5 tivesse algum dia sido imposto, seria 
apenas um limite arbitrário que excluiria pesquisa poten- 
cialmente significativa. Logo, devemos ser cuidadosos na 
adoção de tais padrões; não é prático usar um conjunto 
único de regras de corte que se aplique para todos os mo- 
delos SEM de qualquer tipo. 


Especificação inaceitável de modelo para atingir ajus- 
te. É também criticamente importante perceber a distin- 
ção entre teste de teoria e a busca por um bom ajuste. A 
SEM não é usada para se conseguir um bom ajuste; é em- 
pregada para testar teoria. É muito fácil ficar tão obcecado 
com ajuste, que um teste válido de teoria jamais ocorre. Na 
verdade, a busca para se conseguir um valor mágico para 
um índice de ajuste pode levar a diversas práticas desacon- 
selháveis na especificação do modelo [26, 27, 33]. Em cada 
um dos seguintes casos, um pesquisador pode ser capaz de 
aumentar ajuste, mas apenas de uma maneira que compro- 
mete o teste da teoria em questão. Essas ações devem ser 
evitadas sempre que possível, pois cada uma delas tem o 
potencial de limitar indevidamente a habilidade da SEM 
de fornecer um verdadeiro teste do modelo: 


1. Usar apenas dois ou três itens para representar cada cons- 
truto. 

2. Usar um único item para representar um construto e arbitra- 
riamente especificar o erro de mensuração. 

3. Examinar o ajuste de um modelo de mensuração conduzindo 
análises SEM separadas para cada construto ao invés de uma 
análise para o modelo inteiro. O resultado é um conjunto de 
índices de ajuste para cada construto e um modelo geral de 
mensuração que jamais é testado. Esta abordagem conduz a 
múltiplos conjuntos de índices de ajuste, cada um tendo uma 
chance maior de atingir um corte desejado em TLI, GFI, CFI, 
RFI e outros índices do que o modelo como um todo. 

4. Usar uma amostra menor. 

5. Testar um modelo de mensuração usando parcelas de itens, 
o que significa que o conjunto completo de variáveis indica- 
doras (p.ex., 15 indicadores para um construto) é parcelado 
em um pequeno número de indicadores compostos (como 3 
compostos de 5 itens cada). Um composto é essencialmente 
um escore fatorial múltiplo. 


Cada um desses passos pode ser associado com várias 
consequências indesejáveis: 


e Maiores chances de encontrar problemas estatísticos com 
convergência de modelo, estimativas paramétricas menos 
precisas, confiabilidade reduzida de construto, menor poder 
estatístico e uma incapacidade de detectar variáveis observa- 
das que são verdadeiramente problemáticas. 

e Umamelhora artificial de ajuste pela alteração das circunstân- 
cias de um modelo e não-manutenção da fidelidade ao verda- 
deiro significado de um construto ou hipótese. 
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e Problemas que obscurecem validade no conjunto de construtos 
e medidas. Um exemplo comum é a possibilidade de ocultar 
problemas potenciais de validade discriminante que ocorrem 
em casos de elevadas correlações entre construtos ou substan- 
ciais cargas cruzadas de variáveis indicadoras. A execução de 
análises SEM sobre construtos individuais, subconjuntos de 
construtos, ou mesmo o parcelamento ad hoc de itens podem 
ocultar problemas dessa natureza que podem ser encontrados 
quando o modelo completo é testado. 


Ciência dos problemas com esses passos não significa 
que um deles não possa ser necessário na abordagem de 
uma especificação particular de modelo, ou ser diagnos- 
ticamente útil na construção de um modelo. Além disso, 
melhora de ajuste não é uma justificativa apropriada para 
qualquer um desses passos. Sempre se lembre que esses 
procedimentos podem interferir no teste geral de um mo- 
delo de mensuração, e, assim, a teoria de medição conti- 
nua não testada até que todas as variáveis medidas sejam 
incluídas em um só teste. 


Diretrizes para estabelecer ajuste aceitável e inaceitá- 
vel. Uma regra simples para valores de índice que dife- 
rencia modelos bons de modelos ruins em todas as situa- 
ções não pode ser oferecida. No entanto, diversas diretrizes 
gerais podem auxiliar na determinação da aceitabilidade de 
ajuste para um dado modelo: 


e Usar múltiplos índices de diferentes tipos: Geralmente, o em- 
prego de três ou quatro índices de ajuste fornece evidência 
adequada de ajuste de modelo. Pesquisas recentes sugerem 
um conjunto razoavelmente comum de índices que funcio- 
nam adequadamente em uma vasta gama de situações: CFI, 
TLI, RNI, Gama chapéu, SRMR e RMSEA. Um pesquisa- 
dor não precisa apelar para todos esses índices por conta da 
redundância entre eles (ver Apêndice 10C, o qual descreve 


esses índices em mais detalhes). Contudo, o pesquisador 
deve usar pelo menos um índice incremental e um índice 
absoluto, além do valor X% e dos graus de liberdade asso- 
ciados. Pelo menos um dos índices deve ser de má quali- 
dade de ajuste. Um modelo que relata o valor x e graus 
de liberdade, CFI e RMSEA fregiientemente disporá de 
suficiente informação para sua avaliação. Quando comparar 
modelos de complexidade variada, o pesquisador pode tam- 
bém desejar o acréscimo do PNFI. Outra evidência sugere 
que a aplicação de uma única regra de qualidade de ajuste 
que exija um índice de 0,95 ou mais não é melhor do que 
simplesmente usar apenas o teste GOF de X% [32]. 

Ajustar os valores de corte de índice com base em caracterís- 
ticas do modelo: A Tabela 10-2 oferece algumas orientações 
para o emprego de índices de ajuste em diferentes situações. 
As orientações são baseadas principalmente em pesquisa 
de simulação que considera diferentes tamanhos amostrais, 
complexidades e graus de erro na especificação de modelos 
para examinar o quão precisamente vários índices de ajuste 
funcionam [19,32]. Um ponto-chave ao longo dos resultados 
é que modelos mais simples e amostras menores devem ser 
sujeitos a avaliação mais estrita do que os modelos mais com- 
plexos com amostras maiores. Analogamente, modelos mais 
complexos com amostras menores podem demandar critérios 
de algum modo menos estritos para avaliação com os múlti- 
plos índices de ajuste [41]. 


Por exemplo, com base em uma amostra de 100 respon- 
dentes e um modelo de quatro construtos com um total 
de somente 12 variáveis indicadoras, evidência de bom 
ajuste incluiria um valor 0) insignificante, um CFI de 
pelo menos 0,97 e uma RMSEA de 0,08 ou menos. No 
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TABELA 10-2 Características de diferentes índices de ajuste demonstrando qualidade de ajuste ao longo de situações distintas de modelagem 


N<250* N> 250 
Número de 

Estatística variáveis (m) ms< 12 12<m<30 m>30 m<12** 12<m<30 m>30 

É Valores-p insig- Valores-p signi- Valores-p signi- Valores-p in- Valores-p signi- Valores-p signifi- 
nificantes espe- ficantes podem ficantes podem significantes ficantes podem | cantes podem ser 
rados resultar mesmo ser esperados podem resultar seresperados esperados 

com bom ajuste com bom ajuste 

CFl ou TLI 0,97 oumelhor 0,950umelhor Acimade0,92  0,950umelhor Acimade 0,922 Acima de 0,90 

RNI Não pode diag- 0,950umelhor Acimade 0,922  0,950umelhor, Acima de 0,92, Acima de 0,90, mas 
nosticar má mas não use mas não use não use com N > 
especificação com N>1000 | com N> 1000 1000 
tão bem 

SRMR Pode ter viés 0,08 ou menos Menos que 0,09 Pode ter viés 0,08 ou menos | 0,08 ou menos 
para cima;use (com CFI de (com CFlacima paracima;use (com CFlacima (com CFl acima de 
outros índices 0,95 oumaior) de0,92) outros índices de 0,92) 0,92) 

RMSEA Valores < 0,08 Valores < 0,08 Valores < 0,08 Valores < 0,07 Valores < 0,07 Valores < 0,07 com 
com CFI=0,97 comCFlde 0,95 com CFlacima com CFlde 0,97 com CFlde 0,92 CFI de 0,90 ou 
ou maior ou maior de 0,92 ou maior ou maior maior 


Nota: m = número de variáveis observadas; N se aplica ao número de observações por grupo quando se usa CFA para múltiplos grupos ao mesmo tempo. 


* N. de R. T.: Aparentemente os autores ignoraram a possibilidade de N ser igual a 250, não esclarecendo onde incluir este valor. 


** N. de R. T.: A expressão correta seria “m < 12”. 
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(Continuação) 
entanto, é extremamente não-realista aplicar os mesmos 


critérios para um modelo de oito construtos com 50 va- 
riáveis indicadoras testadas com uma amostra de 2000 
respondentes. 


Vale a pena repetir que a Tabela 10-2 é dada mais com 
o intuito de oferecer uma idéia ao pesquisador de como ín- 
dices de ajuste podem ser usados do que propriamente para 
sugerir regras absolutas para padrões que separem ajuste 
bom do ruim. Além disso, vale repetir que mesmo um mo- 
delo com bom ajuste ainda deve atender aos outros critérios 
para validade discutidos em cada um dos capítulos subse- 
quentes. 

e Usar índices para comparar modelos. A despeito de ser di- 
fícil determinar absolutamente quando um modelo é bom 
ou ruim, é muito mais fácil determinar que um modelo é 
melhor do que outro. Os índices da Tabela 10-2 funcionam 
bem na diferenciação da superioridade relativa de modelos. 
Um CFI de 0,95, por exemplo, indica um modelo com me- 
lhor ajuste do que outro de mesma complexidade mas com 
um CFI de 0,85, particularmente no caso com modelos ani- 
nhados. Um modelo é aninhado com outro se ele contém o 
mesmo número de variáveis e pode ser formado a partir do 
outro modelo via alteração das relações, como acréscimo ou 
eliminação de caminhos. 

e A busca de melhor ajuste à custa do teste de um verdadeiro 
modelo não é um bom negócio. Muitas especificações po- 
dem influenciar o ajuste do modelo, e assim o pesquisador 
deve se certificar de que todas as especificações devam ser 
feitas para melhor aproximar a teoria a ser testada, ao invés 
de se esperar que se aumente o ajuste. 


Revisão. Não é exagero enfatizar que essas são diretri- 
zes de uso e não regras que garantem um modelo corre- 
to. Assim, nenhum valor específico em qualquer índice 
pode separar modelos em ajustes aceitáveis e inaceitáveis. 
Quando usamos vários modelos juntos, eles oferecem 
evidência que permite uma avaliação de um modelo te- 
órico. Assim como nenhum critério absoluto estabelece 
uma taxa de erro Tipo I “aceitável” em estatística alguma, 
nenhum critério absoluto define aceitabilidade de GOF 
também. Pesquisadores sempre devem dar espaço para 
circunstâncias atenuantes não-antecipadas que possam 
afetar a interpretação de resultados do modelo. Questões 
relacionadas ao modelo em si, à amostra e ao contexto da 
pesquisa sempre podem influenciar aquilo que é aceitável 
ou não. Assim, a situação afeta e deve afetar a aceitabili- 
dade de modelos. 


Resumo 

O estágio 4 introduz procedimentos usados para estabe- 
lecer a validade de um modelo de mensuração. Ajuste é 
um critério útil na avaliação da validade de um modelo, 
mas avaliar ajuste geralmente não é uma tarefa simples. 
Apesar de o teste GOF de x” ser conceitualmente simples, 
problemas computacionais impedem que ele seja empre- 
gado como o único teste estatístico (como o teste F geral 


em regressão ou ANOVA). Assim, muitos outros índices 
foram desenvolvidos. Não existe qualquer valor absoluto 
de corte que possa distinguir bons modelos de ruins para 
qualquer um desses índices. É claro, porém, que mode- 
los mais simples demandam padrões mais estritos do que 
modelos mais complexos. Além disso, é importante evitar 
várias práticas ruins que possam resultar unicamente da 
busca de um bom ajuste. O leitor aprenderá mais sobre 
como ajuste pode ser avaliado por meio das ilustrações 
nos próximos capítulos. 


Estágio 5: Especificação do modelo estrutural 


A especificação do modelo de mensuração (isto é, a de- 
signação de variáveis indicadoras para os construtos que 
elas devem representar) é um passo crítico no desenvolvi- 
mento de um modelo SEM. Esta atividade é realizada no 
estágio 2. O estágio 5 envolve a especificação do modelo 
estrutural pela designação de relações de um construto 
com outro, com base no modelo teórico proposto. A es- 
pecificação de modelo estrutural foca o emprego do tipo 
de relação da Figura 10-1c para representar hipóteses es- 
truturais do modelo do pesquisador. Em outras palavras, 
quais relações de dependência existem entre construtos? 
Cada hipótese representa uma relação específica que deve 
ser qualificada. 


Retornamos ao modelo de compromisso de cliente do 
início do capítulo. O modelo de mensuração mostrado 
na Figura 10-7 não inclui quaisquer relações estruturais 
entre os construtos. Todos os construtos foram conside- 
rados exógenos e correlacionados. 

Ao especificar um modelo estrutural, o pesquisador 
agora seleciona cuidadosamente o que se acredita serem 
os fatores-chave que influenciam gastos de clientela. Este 
serviço em particular dá uma forte razão para se suspei- 
tar que percepções de preço (neste caso, se os preços são 
percebidos como sendo justos), de serviço (avaliação da 
qualidade do serviço) e de atmosfera (quão agradáveis 
são as instalações) afetam gastos da clientela (a quan- 
tia relativa de recursos que um cliente gasta com este 
provedor de serviços), que, por sua vez, afeta o compro- 
misso dos clientes. Com base em suficiente teoria, que é 
apenas referida aqui, o pesquisador propõe as seguintes 
relações estruturais: 


H,: Percepções de preço por parte do consumidor 
são positivamente relacionadas com gastos de 
clientela. 

H, Percepções de serviço por parte do consumidor 
são positivamente relacionadas com gastos de 
clientela. 

H, Percepções de atmosfera por parte do consumi- 
dor são positivamente relacionadas com gastos 
de clientela. 
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H, Gasto de clientela é positivamente relacionado 
com compromisso dos clientes. 


Essas relações são mostradas na Figura 10-8. H, é 
especificada com a seta conectando Preço e Gastos de 
Clientes e é designada com H,. Analogamente, H,, H, 
e H, são especificadas. A parte interna deste diagrama 
envolvendo as relações de dependência entre construtos 
representa a parte estrutural do modelo. A parte externa 
também retrata a estrutura especificada de mensuração 
que já teria sido testada no estágio anterior. Qualquer 
correlação entre construtos exógenos é explicada com re- 
lações correlacionais (como na Figura 10-1d). Portanto, 
as três relações entre construtos exógenos são especifica- 
das exatamente como foram no modelo de mensuração. 

Sob outro ponto de vista, o modelo estrutural pode 
ser especificado adicionando-se restrições ao modelo de 
mensuração. Caminhos estruturais específicos substi- 
tuem as correlações entre construtos para cada relação 
hipotetizada. Com a exceção de relações correlacionais 
entre construtos exógenos, nenhum caminho é esboçado 
entre dois construtos para os quais nenhuma relação di- 
reta de dependência é assumida. Assim, aquelas relações 
são restringidas para serem iguais a zero. 


Apesar de a atenção neste estágio estar sobre o mo- 
delo estrutural, a estimação do modelo SEM requer que 


E Pê . 
1 

E a H 

E se 

E ba 


Atmosfera 


(Es) 


X Xo 


E E E E 


as especificações de mensuração sejam incluídas também. 
Deste modo, o diagrama de caminhos representa tanto a 
parte estrutural quanto de mensuração de SEM em um 
modelo geral. Logo, o diagrama de caminhos na Figura 
10-8 mostra não apenas o conjunto completo de constru- 
tos e indicadores no modelo de mensuração, mas também 
impõe as relações estruturais entre construtos. O modelo 
agora está pronto para estimação. Em outros termos, a 
teoria geral está para ser testada, incluindo as relações te- 
orizadas de dependência entre construtos. 


Estágio 6: Avaliação da validade 
do modelo estrutural 


O último estágio envolve esforços para testar validade do 
modelo estrutural e suas correspondentes relações teóri- 
cas presumidas (H, — H,). Perceba que se o modelo de 
mensuração não sobreviveu a seu teste de validade no es- 
tágio 4, os estágios 5 e 6 não podem ser realizados. Tería- 
mos chegado a um sinal vermelho. Se o estágio 4 propicia 
um sinal verde, significando que o modelo de mensuração 
foi validado, então podemos executar um teste válido das 
relações estruturais. 

Duas diferenças importantes surgem no teste do ajus- 
te de um modelo estrutural relativamente a um modelo 
de mensuração. Primeiro, ainda que o ajuste aceitável do 
modelo geral deva ser estabelecido, modelos alternativos 


Compromisso 
de clientes 
(no) 


Gastos 
de clientes(n;) 


FIGURA 10-8 Diagrama completo de caminhos exibindo relações estruturais teorizadas e a especificação completa de mensuração. 


Nota: As especificações do modelo de mensuração são mostradas em cinza. Já as especificações do modelo estrutural são mostradas em preto. 
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ou concorrentes podem ser comparados se uma aborda- 
gem apropriada é adotada. Segundo, uma ênfase particu- 
lar é dada sobre os parâmetros estimados para as relações 
estruturais, pois elas oferecem evidência empírica direta 
sobre as relações hipotéticas descritas no modelo estru- 
tural. 


GOF do modelo estrutural. O processo de se estabelecer 
a validade do modelo estrutural segue as diretrizes gerais 
esboçadas no estágio 4. Os dados observados ainda são 
representados pela matriz de covariância observada. Isso 
não muda, e nem deve mudar. Não obstante, uma nova 
matriz SEM de covariância estimada é calculada, e é dife- 
rente daquela do modelo de mensuração. Tal diferença é 
um resultado das relações estruturais no modelo estrutu- 
ral. Lembre-se que o modelo de mensuração assume que 
todos os construtos são correlacionados entre si (relações 
via correlações). No entanto, em um modelo estrutural, 
as relações entre alguns construtos são assumidas como 
sendo 0. Portanto, para quase todos os modelos SEM, a 
GOF de x” para o modelo de mensuração será menor do 
que a GOF de x para o modelo estrutural. Quando os 
valores GOF diferem, o ajuste do modelo estrutural tam- 
bém deve ser avaliado. 

O ajuste geral pode ser avaliado usando os mesmos cri- 
térios do modelo de mensuração: usando o valor x para 
o modelo estrutural, um outro índice absoluto, um índice 
incremental, um indicador de qualidade de ajuste e um 
de má qualidade de ajuste. Essas medidas estabelecem a 
validade do modelo estrutural, mas comparações entre os 
ajustes gerais também devem ser feitas com o modelo de 
mensuração. Geralmente, quanto mais próxima a GOF 
do modelo estrutural estiver do modelo de mensuração, 
melhor o ajuste do modelo estrutural, uma vez que o ajus- 
te do modelo de mensuração fornece um limite superior 
para a GOF de um modelo estrutural convencional. 


Ajuste competitivo 

Anteriormente, uma avaliação de modelos concorrentes 
foi discutida como uma abordagem para SEM. O princi- 
pal objetivo é garantir que o modelo proposto não ape- 
nas tenha ajuste aceitável, mas que desempenhe melhor 
do que algum modelo alternativo. Caso contrário, o mo- 
delo alternativo é sustentado. A comparação de modelos 
pode ser realizada pela avaliação de diferenças em índi- 
ces de ajuste incremental ou de parcimônia, juntamente 
com diferenças entre valores de GOF de x para cada 
modelo. 


Comparação de modelos aninhados. Geralmente, mo- 
delos aninhados concorrentes SEM são comparados com 
base em uma estatística de diferença de qui-quadrados 
(Ax)). O valor x” de algum modelo de referência (B) é 
subtraído do valor x de um modelo aninhado alternativo 
(A) menos restrito. Analogamente, a diferença em graus 
de liberdade é encontrada, com um grau de liberdade a 


menos para cada caminho adicional que é estimado. A 
equação a seguir é usada para computação: 


à end 2 
AX dt = XarcBy” Xara) 
Adf = df(B) — df(A) 


Como a diferença de dois valores distribuídos x” é ela 
própria distribuída x”, podemos testar quanto a significân- 
cia estatística, dada uma diferença Axº e a diferença em 
graus de liberdade (Adf). Por exemplo, para um mode- 
lo com uma diferença de um grau de liberdade (Adf = 1, 
o que significa um caminho extra no modelo A), um Ay 
de 3,84 ou mais seria significante no nível 0,05. O pesqui- 
sador concluiria que o modelo com um caminho a mais 
fornece um ajuste melhor, com base na redução signifi- 
cativa na GOF de x”. Modelos aninhados também podem 
ser formados pela eliminação de caminhos, com o mesmo 
processo seguido no cálculo de diferenças em x” e graus 
de liberdade. 


Um exemplo de um modelo aninhado na Figura 10-8 
pode ser o acréscimo de um caminho estrutural a partir 
do construto Preços diretamente para o construto Com- 
promisso do Cliente. Este caminho extra reduziria os 
graus de liberdade em um a menos. O novo modelo seria 
reestimado, e o AX, calculado. Se for maior que 3,84, 
então o pesquisador concluiria que o modelo alternati- 
vo tem um ajuste significantemente melhor. Antes que o 
caminho seja acrescentado, porém, é necessário suporte 
teórico para a nova relação. 


Comparação com outros modelos concorrentes. O usuá- 
rio deve saber como executar este cálculo, pois ele nor- 
malmente é realizada manualmente, e não por um progra- 
ma SEM. Tal procedimento também pode ser utilizado 
para comparar o ajuste de um modelo estrutural com o 
ajuste de um modelo de mensuração. Como o modelo es- 
trutural é uma versão mais restrita do de mensuração, é 
aninhado com ele. 


Portanto, a GOF de x” para os resultados do modelo de 
mensuração no exemplo de compromisso de cliente pode 
ser comparado com a GOF de x para os resultados do 
modelo estrutural correspondentes à Figura 10-8 usando 
-se um teste Ax”. O teste resulta em Adf = 3, pois as três 
relações entre construtos são assumidas como sendo O 
(cada construto exógeno para Compromisso de Cliente). 
Se o teste Axº for insignificante, ele oferecerá suporte 
para o modelo estrutural. 


Modelos equivalentes. E importante saber que boas 
estatísticas de ajuste não provam que uma teoria é a 
melhor maneira de explicar a matriz de covariância ob- 
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servada. Como anteriormente descrito, modelos equiva- 
lentes podem potencialmente produzir a mesma matriz 
de covariância estimada. Logo, qualquer modelo dado, 
mesmo com bom ajuste, é apenas uma explicação poten- 
cial; outros arranjos empíricos podem se ajustar igual- 
mente bem. Em outras palavras, bom ajuste empírico 
não demonstra que um dado modelo é a única estrutura 
verdadeira. Estatísticas favoráveis de ajuste são alta- 
mente desejáveis, mas é importante perceber que mes- 
mo que elas sejam encontradas, outros modelos talvez 
expliquem os dados igualmente bem ou até melhor. De 
fato, muitos modelos alternativos podem fornecer um 
ajuste equivalente [38]. 

Esta questão reforça ainda mais a necessidade de se 
construir modelos de mensuração sustentados em teoria 
sólida. Modelos mais complexos podem ter uma quantia 
muito grande de modelos equivalentes. No entanto, é bem 
possível que muitos, ou todos, façam pouco sentido, dada 
a natureza conceitual dos construtos envolvidos. Assim, 
no final, resultados empíricos oferecem alguma evidência 
de validade, mas o pesquisador deve fornecer evidência 
teórica que seja igualmente importante na validação de 
um modelo. 


Teste das relações estruturais 

O bom ajuste de modelo por si só é insuficiente para 
sustentar uma teoria estrutural proposta. O pesquisador 
também deve examinar as estimativas paramétricas in- 
dividuais que representam cada hipótese específica. Um 
modelo teórico é considerado válido na medida em que as 
estimativas de parâmetros sejam: 


1. Estatisticamente significantes e na direção prevista. Ou seja, 
elas são maiores que zero para uma relação positiva e me- 
nores que zero para uma relação negativa. 

2. Não-triviais. Esta característica deve ser verificada usando- 
se estimativas de cargas completamente padronizadas. A 
orientação aqui é a mesma de qualquer outra técnica multi- 
variada. 


Logo, o modelo estrutural mostrado na Figura 10-8 é 
considerado aceitável apenas quando ele demonstra ajus- 
te aceitável e quando as estimativas de caminhos repre- 
sentando cada uma das quatro hipóteses são significantes 
e na direção prevista. O pesquisador também pode exami- 
nar as estimativas de variância explicada para os constru- 
tos endógenos de maneira análoga à análise de R” feita em 
regressão múltipla. 


Resumo 

O estágio final de SEM fornece um teste de quão bem a 
teoria de um pesquisador sobre a maneira como constru- 
tos se relacionam entre si realmente adere à realidade. 
Realidade em SEM é representada por uma matriz de 
covariância observada. O modelo de mensuração pode 
sustentar a teoria proposta, mas o pesquisador deve 
especificar as relações estruturais e reavaliar o mode- 
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Estágios SEM 4-6 


e Quando modelos ficam mais complexos, aumenta 

a possibilidade de modelos alternativos com ajuste 

equivalente 

Múltiplos índices de ajuste devem ser usados para 

avaliar qualidade de ajuste de um modelo e devem 

incluir: 

e Ovalor y eo df associado 
Um índice de ajuste absoluto (ou seja, GFI, RMSEA 
ou SRMR) 

Um índice de ajuste incremental (ou seja, CFI ou 
TLI) 

Um índice de qualidade de ajuste (GFI, CFI, TLI 
etc.) 

Um índice de má qualidade de ajuste (RMSEA, 
SRMR etc.) 

Nenhum valor único “mágico” para os índices de ajuste 

separa modelos bons de ruins, e não é prático aplicar 

um único conjunto de regras de corte para todos os 
modelos de mensuração, e nem para todos os modelos 

SEM de qualquer tipo 

A qualidade do ajuste depende consideravelmente das 

características do modelo, incluindo tamanho amostral 

e complexidade do modelo: 

e Modelos simples com amostras pequenas devem ser 
mantidos sob estritos padrões de ajuste; até mesmo 
um valor-p insignificante para um modelo simples 
pode não ser significativo 
Modelos mais complexos com amostras maiores 
não devem ser mantidos para os mesmos padrões 
estritos, e, assim, quando amostras são grandes e 
o modelo contém um grande número de variáveis 
medidas e estimativas paramétricas, valores de corte 
de 0,95 sobre medidas de GOF são não-realistas 


lo. Esta segunda avaliação de ajuste é conduzida para 
fornecer informação na forma do ajuste geral e de es- 
timativas individuais dos parâmetros para os caminhos 
estruturais. Mais detalhes são fornecidos sobre proce- 
dimentos usados neste estágio nos Capítulos 11 e 12, 
incluindo discussões sobre medidas diagnósticas para 
os modelos estrutural e de mensuração. A Figura 10-9 
fornece uma visão esquemática dos estágios e algumas 
das atividades envolvidas no teste de um modelo SEM. 
Observe que ela assume que o pesquisador está interes- 
sado em testar um modelo estrutural completo. Como 
veremos no Capítulo 11, por vezes um teste de um mo- 
delo de mensuração pode sozinho tratar de questões de 
pesquisa importantes. 


Resumo 


Vários objetivos importantes de aprendizado foram for- 
necidos para este capítulo. Tais objetivos reunidos ofe- 
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Denifição dos construtos individuais 


Quais itens devem ser usados como variáveis medidas? 


Desenvolver e especificar o modelo de mensuração 


Fazer com que variáveis medidas com construtos esbocem 


um diagrama de caminhos para o modelo de mensuração 


| 


Planejamento de um estudo para produzir resultados empíricos 


Avaliar a adequação do tamanho amostral 


Escolher o método de estimação e a abordagem de dados perdidos 


| 


Avaliação da validade do modelo de mensuração 


Avaliar GOF e validade dos construtos do modelo de mensuração 


O modelo de mensuração 
é válido? 


Prosseguir com o teste 
do modelo estrutural 
nos estágios 5 e 6 


Especificar modelo estrutural 


Converter modelo de mensuração para estrutural 


| 


Avaliar validade do modelo estrutural 


Estágio 1 

Estágio 2 

Estágio 3 

Estágio 4 
Refinar medidas Não 
e delinear novo 
estudo 

Estágio 5 

Estágio 6 


Avaliar a GOF e significância, direção e tamanho 


das estimativas paramétricas estruturais 


Refinar o modelo 


e testar com 
novos dados 


O modelo estrutural é 
válido? 


Extrair conclusões 
substanciais e 
recomendações 


FIGURA 10-9 Processo de seis estágios para modelagem de equações estruturais. 


recem uma visão básica de SEM. Esta visão básica deve 
viabilizar uma melhor compreensão das ilustrações mais 
específicas que seguem nos próximos capítulos. 


Compreender as características distintas de SEM. A 
SEM é uma abordagem flexível para examinar como as 
coisas se relacionam entre si. Assim, as aplicações da 
SEM podem parecer bastante distintas. No entanto, três 
características fundamentais da SEM são (1) a estimação 
de múltiplas relações de dependência inter-relacionadas, 
(2) uma habilidade para representar conceitos não-obser- 
vados em tais relações e corrigir erros de mensuração no 


processo de estimação, e (3) um foco na explicação da co- 
variância entre os itens medidos. 


Diferenciar variáveis de construtos. Os modelos tipi- 
camente testados usando SEM envolvem um modelo de 
mensuração e um estrutural. A maioria das técnicas multi- 
variadas discutidas nos capítulos anteriores se concentram 
na análise direta de variáveis. Variáveis são os itens reais 
que são medidos por meio de um levantamento, de obser- 
vações ou algum outro instrumento de medição. Variáveis 
são consideradas observáveis na medida em que podemos 
obter uma medida direta delas. Construtos são fatores 
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inobserváveis ou latentes que são representados por uma 
variável estatística que consiste de múltiplas variáveis. Em 
termos simples, múltiplas variáveis são matematicamente 
reunidas para representar um construto. Construtos po- 
dem ser exógenos ou endógenos. Construtos exógenos são 
o equivalente latente multi-itens de variáveis independen- 
tes. Eles são construtos que são determinados por fatores 
fora do modelo. Construtos endógenos são o equivalente 
latente multi-itens de variáveis dependentes. 


Entender modelagem de equações estruturais e como 
ela pode ser imaginada como uma combinação de técni- 
cas multivariadas familiares. A SEM pode ser pensada 
como uma combinação de análise fatorial e análise de re- 
gressão múltipla. A parte do modelo de mensuração é se- 
melhante à análise fatorial no sentido de que ela também 
demonstra como variáveis medidas têm cargas sobre um 
número menor de fatores (construtos). Diversas analogias 
com regressão se aplicam, mas o relevante entre elas é o 
fato de que resultados importantes ou construtos endóge- 
nos são previstos usando-se outros múltiplos construtos 
da mesma maneira que variáveis independentes prevêem 
variáveis dependentes em regressão múltipla. 


Conhecer as condições básicas para causalidade e como 
SEM pode ajudar a estabelecer uma relação de causa e 
efeito. Teoria pode ser definida como um conjunto sis- 
temático de relações que fornecem uma explicação con- 
sistente e abrangente de um fenômeno. A SEM se tornou 
a ferramenta multivariada mais proeminente para testes 
da teoria de comportamentos. A história da SEM se de- 
senvolve a partir da ânsia de se testar modelos causais. 
Teoricamente, quatro condições devem estar presentes 
para estabelecer causalidade: (1) covariação, (2) seqiên- 
cia temporal, (3) associação legítima e (4) suporte teóri- 
co. a SEM pode estabelecer evidências de covariação por 
meio de testes de relações representadas por um modelo. 
A SEM não pode, usualmente, demonstrar que a causa 
ocorreu antes do efeito, pois dados cross-section são, na 
maioria das vezes, usados em SEM. Modelos SEM que 
usam dados longitudinais podem ajudar a demonstrar 
sequência temporal. A evidência de associação legítima 
entre causa e efeito pode ser dada, pelo menos em parte, 
pela SEM. Se a adição de outras causas alternativas não 
elimina a relação entre causa e efeito, então a inferência 
causal se torna mais forte. Por fim, suporte teórico somen- 
te pode ser fornecido com discernimento. Descobertas 
empíricas por si mesmas não podem tornar sensata uma 
relação. Assim, a SEM pode ser útil para se estabelecer 
causalidade, mas o simples emprego da SEM em qualquer 
conjunto de dados não significa que inferências causais 
podem ser estabelecidas. 


Explicar os tipos básicos de relações envolvidas em 
SEM. Os quatro tipos de relações teóricas fundamen- 
tais em um modelo SEM são descritos na Figura 10-1, a 


qual também mostra a representação gráfica convencio- 
nal de cada tipo. O primeiro exibe relações entre cons- 
trutos latentes e variáveis medidas. Construtos latentes 
são representados por curvas ovais, € variáveis medidas, 
por retângulos. O segundo mostra covariação ou corre- 
lação simples entre construtos. Isso não implica qualquer 
sequência causal e não distingue construtos exógenos de 
endógenos. Esses dois primeiros tipos de relações são fun- 
damentais na formação de um modelo de mensuração. O 
terceiro tipo de relação mostra como um construto exó- 
geno se relaciona com um endógeno e pode representar 
uma inferência causal na qual o construto exógeno é uma 
causa, e o endógeno, um efeito. A quarta relação descre- 
ve como um construto endógeno se relaciona com outro. 
Também pode representar uma segiiência causal de um 
construto endógeno para outro. 


Entender que o objetivo de SEM é explicar covariância e 
como ela se traduz no ajuste de um modelo. Às vezes, 
SEM é chamada de análise de estrutura de covariância. 
Os algoritmos que executam a estimação da SEM têm a 
meta de explicar a matriz de covariância observada das 
variáveis, S, usando uma matriz de covariância estimada, 
>, calculada usando as equações de regressão que repre- 
sentam o modelo do pesquisador. Em outras palavras, a 
SEM busca por um conjunto de estimativas de parâme- 
tros produzindo valores de covariância estimada que se 
aproximam muito dos valores de covariância observada. 
Quanto mais próximos ficam tais valores, melhor se ajusta 
o modelo. Ajuste indica o quão bem um modelo especifi- 
cado reproduz a matriz de covariância entre os itens medi- 
dos. A estatística básica de ajuste da SEM é o x”. Contudo, 
sua sensibilidade a tamanho da amostra e complexidade 
do modelo acarretou o desenvolvimento de muitos outros 
índices de ajuste. O ajuste é melhor avaliado usando-se 
múltiplos índices de ajuste. É importante também perce- 
ber que nenhum valor mágico determina quando um mo- 
delo tem o melhor ajuste. Ao invés disso, o contexto do 
modelo deve ser levado em consideração na avaliação do 
ajuste. Modelos simples com pequenas amostras devem 
ser tratados com padrões diferentes dos usados em mode- 
los mais complexos testados com amostras maiores. 


Saber como representar visualmente um modelo usando 
um diagrama de caminhos. O conjunto inteiro de rela- 
ções que constitui um modelo SEM pode ser visualmen- 
te descrito por meio de um diagrama de caminhos. Cada 
tipo de relação é convencionalmente representado com 
um tipo diferente de seta e abreviado com um símbolo 
distinto. A Figura 10-8 retrata um diagrama de caminhos 
que mostra um modelo de mensuração e um estrutural. A 
parte interna representa o modelo estrutural. A externa, 
o modelo de mensuração. 


Listar os seis estágios da modelagem de equações estru- 
turais e compreender o papel da teoria no processo. A 
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Figura 10-9 lista os seis estágios no processo SEM. Ele 
começa com a escolha das variáveis que serão medidas. 
Conclui com a avaliação do ajuste do modelo estrutural 
geral. Deve ser enfatizado também que a teoria desem- 
penha um papel fundamental em cada passo do processo. 
A meta de uma SEM é fornecer um teste da teoria. As- 
sim, sem teoria, um verdadeiro teste de SEM não pode 
ser concluído. 

Como anteriormente mencionado, este capítulo não 
inclui um exemplo estendido de HBAT. No lugar disso, 
um novo exemplo HBAT será introduzido no próximo 
capítulo. Ao longo dos próximos dois capítulos, será ilus- 
trado o uso completo da SEM para testar relações-chave 
que ajudarão a HBAT a tomar decisões administrativas 
estratégicas. 


Questões 


1. Qual é a diferença entre um construto latente e uma variá- 
vel medida? 

2. Quais são as características marcantes da SEM? 

3. Descreva como pode ser computada a matriz de covariância 
estimada em uma análise SEM (2,,). Por que a comparamos 
com 8? 


4. Qual é a semelhança entre a modelagem de equações estru- 
turais e as outras técnicas multivariadas discutidas em capí- 
tulos anteriores? 

5. O que é uma teoria? Como uma teoria é representada em 
uma estrutura SEM? 

6. O que é uma correlação ilegítima? Como ela pode ser reve- 
lada usando-se SEM? 

7. O que é ajuste? 

8. Qual é a diferença entre um índice de ajuste absoluto e um 
relativo? 

9. De que forma o tamanho amostral afeta a modelagem de 
equações estruturais? 

10. Por que não estão disponíveis valores mágicos para distin- 
guir ajuste bom de ajuste ruim em situações em geral? 

11. Faça um diagrama de caminhos com dois construtos exóge- 
nos e um endógeno. Cada construto exógeno é medido por 
cinco itens, e o endógeno, por quatro itens. Os dois constru- 
tos exógenos devem estar negativamente relacionados com 
o endógeno. 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustra problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 
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Estimação de relações usando análise de caminhos 


Qual era o objetivo de se desenvolver o diagrama de ca- 
minhos? Ele é a base para a análise de caminhos, o proce- 
dimento para estimação empírica da força de cada relação 
(caminho) descrita no diagrama. A análise de caminhos 
calcula a força das relações usando somente uma matriz 
de correlação ou covariância como entrada. Descrevemos 
o processo básico na próxima seção, usando um exemplo 
simples para ilustrar como as estimativas são realmente 
computadas. 


Identificação de caminhos 


O primeiro passo é identificar todas as relações que co- 
nectam dois construtos quaisquer. A análise de cami- 
nhos permite decompor a correlação simples (bivariada) 
entre duas variáveis quaisquer na soma dos componen- 
tes que conectam tais pontos. O número e tipos de ca- 
minhos componentes entre duas variáveis quaisquer são 
estritamente uma função do modelo proposto pelo pes- 
quisador. 

Um caminho composto é um caminho ao longo das se- 
tas de um diagrama que segue três regras: 


1. Após seguir adiante em uma seta, o caminho não pode re- 
troceder; mas o caminho pode ir para trás quantas vezes fo- 
rem necessárias antes de ir para frente. 

2. O caminho não pode seguir por meio da mesma variável 
mais do que uma vez. 

3. O caminho pode incluir apenas uma seta curva (par de va- 
riáveis correlacionadas). 


Quando se aplicam essas regras, cada seta representa 
um caminho. Se apenas uma seta conecta dois construtos 
(a análise de caminhos também pode ser conduzida com 
variáveis), então a relação entre os mesmos é igual à es- 
timativa de parâmetro entre os dois construtos. Por en- 
quanto, essa relação pode ser chamada de relação direta. 
Cobrimos detalhadamente relações estruturais diretas e 
indiretas no Capítulo 12. Se houver múltiplas setas ligan- 
do um construto a outro, como em X > Y 5 Z, então 
o efeito de X sobre Z é igual ao produto das estimativas 
paramétricas para cada seta. Este conceito pode parecer 
bastante complicado, mas um exemplo o torna fácil de se 
acompanhar: 


A Figura 10A-1 retrata um modelo simples com dois 
construtos exógenos (X, e X,) causalmente relacionados 
com o construto endógeno (Y,). O caminho por corre- 


lação A é X, correlacionado com X,, o caminho B é o 
efeito de X, prevendo Y,, e € mostra o efeito de X, pre- 
vendo Y,. O valor para Y, pode ser dado simplesmente 
com uma equação de regressão: 


Y=bX+bX, 
Podemos agora identificar os caminhos direto e in- 


direto em nosso modelo. Para facilitar a referência aos 
caminhos, os causais são chamados de A,Be €. 


Caminhos diretos Caminhos indiretos 


A-XaxX, 
B-XayY, AC-=X aY, 
C-=XayY, AB-=X,aY, 


Estimação da relação 


Com os caminhos diretos e indiretos agora definidos, 
podemos representar a correlação entre cada construto 
como a soma dos caminhos diretos e indiretos. 


As três correlações únicas entre os construtos podem ser 
mostradas como compostas de caminhos diretos e indi- 
retos como se segue: 


Corr, , ps A 
Corr, = B+AC 
Cor o E C+AB 


Primeiro, de X, e X, é simplesmente igual a A. A 
correlação de X, e Y, (Corr, y) pode ser representada 
como dois caminhos: Be AC. O símbolo B representa 
o caminho direto de X, a Y,, e o outro caminho (com- 
posto) segue a seta curvilínea de X, para X, e então 
para Y,. Analogamente, a correlação de X, e Y, pode 
ser mostrada como composta de dois caminhos causais: 
Ce AB. 


Uma vez que as correlações são definidas em termos 
de caminhos, os valores das correlações observadas po- 
dem ser substituídos e as equações podem ser resolvidas 
para cada caminho separadamente. Os caminhos então 
representam as relações causais entre construtos (seme- 
lhantemente a um coeficiente de regressão) ou estimati- 
vas correlacionais. 
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Diagrama de caminhos 


X 
Atitude de 
colega 


Xp 
Ambiente 
de trabalho 


Y 


Satisfação com 
o emprego 


Correlações como caminhos compostos 


Corrxx = À 
Corrx,y, = B+AC 
Corrxy, = C+AB 


Correlações bivariadas 


XxX 1,0 
X  0,501,0 


Y, 0,60 0,70 1,0 


Resolução dos coeficientes estruturais 


0,50 = A 
0,60 = B+AC 
0,70 = C+AB 


Substituindo A = 0,50 
0,60 = B+0,50€ 
0,70 = C+0,50B 
Solução para Be C 
B = 0,33 
C = 0,53 


FIGURA 10A-1 Cálculo dos coeficientes estruturais com análise de caminhos. 


Usando as correlações como mostradas na Figura 10A-1, 
podemos resolver as equações para cada correlação (ver 
Figura 10A-1) e estimar as relações causais representa- 
das pelos coeficientes b, e b,. 

Sabemos que A é igual a 0,50, e assim podemos subs- 
tituir este valor nas demais equações. Resolvendo essas 
duas equações, conseguimos valores de B (b,) = 0,33 e 
C(b,) = 0,53. Os cálculos são exibidos na Figura 10A- 
1. Esta abordagem permite que a análise de caminhos 
resolva qualquer relação causal com base apenas nas 
correlações entre os construtos e o modelo causal espe- 
cificado. 


Como você pode perceber a partir deste exemplo sim- 
ples, se mudarmos o modelo de caminhos de alguma for- 
ma, as relações causais também mudarão. Tal mudança 
fornece a base para a modificação do modelo para atingir 
um ajuste melhor, se isso for teoricamente justificado. 

Com essas regras simples, o modelo maior agora pode 
ser delineado simultaneamente, usando correlações ou 
covariâncias como os dados de entrada. Devemos obser- 
var que, quando usados em um modelo maior, podemos 
resolver qualquer número de equações inter-relacionadas. 
Assim, variáveis dependentes em uma relação podem fa- 
cilmente ser independentes em outra. Não importa quão 
grande o diagrama de caminhos fique ou quantas relações 
sejam incluídas, a análise de caminhos fornece uma ma- 
neira de analisar o conjunto de relações. 
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Abreviações SEM 


O guia a seguir ajuda na pronúncia e na compreensão caracteres gregos e romanos, para ajudar a distinguir di- 
de abreviações comuns de SEM. A terminologia SEM ferentes partes de um modelo SEM. 
frequentemente é abreviada com uma combinação de 


Símbolo Pronúncia Significado 

E ksi Um construto associado com variáveis medidas X 

A, lâmbda “x” Um caminho representando a carga fatorial entre um construto 
latente e uma variável medida x 

à, lâmbda “y” Um caminho representando a carga fatorial entre um construto 
latente e uma variável medida y. 

A lâmbda maiúsculo Uma maneira de se referir a um conjunto de estimativas de cargas 
representadas em uma matriz na qual linhas correspondem a va- 
riáveis medidas e colunas se associam a construtos latentes 

1 êta Um construto associado com variáveis medidas Y 

q fi Um caminho representado por uma seta curvada de dois sentidos 
que representa a covariação entre um É e outro É 

Pp fi maiúsculo Uma maneira de se referir à matriz de covariância ou de correla- 
ção entre um conjunto de construtos É 

Y gama Um caminho representando uma relação causal (coeficiente de 
regressão) de um é para um m 

Tr gama maiúsculo Uma maneira de se referir ao conjunto inteiro de relações y para 
um dado modelo 

[8 beta Um caminho representando uma relação causal (coeficiente de 
regressão) de um construto m para outro construto m 

B beta maífúsculo Uma maneira de se referir ao conjunto inteiro de relações B para 
um dado modelo 

ô delta O termo de erro associado com uma variável x entre os valores 
medidos e estimados 

0; téta delta Um modo de se referir às variâncias e covariâncias residuais asso- 
ciadas com as estimativas de x; os itens de variância de erro estão 
na diagonal 

£ épsilon O termo de erro associado com uma variável y entre os valores 
medidos e estimados 

0, téta épsilon Uma maneira de se referir às variâncias e covariâncias residuais 
associadas com as estimativas de y; os itens da variância de erro 
estão na diagonal 

Iê zéta Uma maneira de se capturar a covariação entre erros de constru- 
tom 

T tau Os termos de intercepto para estimação de uma variável medida 

K capa Os termos de intercepto para estimação de um construto latente 


qui-quadrado 


A razão de verossimilhança 
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Detalhe sobre índices GOF selecionados 


O capítulo descreve como pesquisadores desenvolve- 
ram muitos índices de ajuste diferentes que represen- 
tam a GOF de um modelo SEM de diferentes manei- 
ras. Aqui, um pouco mais de detalhe é fornecido sobre 
alguns dos índices críticos, como um esforço para ofe- 
recer uma melhor compreensão sobre qual informação 
está contida em cada um deles. 


Índice de qualidade de ajuste (GFI) 


Se imaginarmos F, como a função de ajuste mínimo de- 
pois que um modelo SEM tenha sido estimado, usando k 
graus de liberdade (S — X,), e se pensarmos em F, como 
a função de ajuste que resultaria se todos os parâmetros 
fossem nulos (nada se relaciona com nada; não há rela- 
ções teóricas), então podemos definir o GFI simplesmen- 
te como: 


E 
GFI=1-— 
F 


0 


Um modelo que se ajusta bem produz uma proporção 
FF, que é muito pequena. Reciprocamente, um modelo 
que não se ajusta bem produz uma F,/F, que é relativa- 
mente grande, pois F, não difere muito de F,. Esta pro- 
porção funciona de maneira parecida com a proporção 
SSE/SST discutida no Capítulo 4. No caso extremo, se 
um modelo falha para explicar qualquer covariância ver- 
dadeira entre variáveis medidas, F,/F, é 1, o que significa 
que o GFI é nulo. 


Raiz do erro quadrático médio 
de aproximação (RMSEA) 
O cálculo de RMSEA é bastante direto e é fornecido aqui 


para demonstrar como os estatísticos procuram corrigir os 
24 2 
problemas usando apenas a estatística x. 


Note que os df são subtraídos do numerador como 
um esforço para capturar a complexidade do modelo. 
O tamanho da amostra é usado no denominador para 
levar isso em conta. Para evitar valores negativos de 
RMSEA, o numerador é considerado zero se df, exce- 
der x. 


Índice de ajuste comparativo (CFI) 
A forma geral de computação do CFI é: 
04 — df) 

O dê) 


CEL=1 - 


Aqui, k representa valores associados com o modelo 
ou teoria especificados pelo pesquisador, ou seja, o ajus- 
te resultante com k graus de liberdade. N denota valores 
associados com o modelo estatístico nulo. Além disso, a 
equação é normada para valores entre O e 1 - com valores 
mais altos indicando ajuste melhor — com substituição por 
um valor adequado (isto é, zero) se um valor x for menor 
que os correspondentes graus de liberdade. 


Índice de Tucker-Lewis (TLI) 


A equação para o TLI é dada aqui para fins de compa- 
ração: 
o df, df, 


Novamente, N e k se referem aos modelos nulo e espe- 
cificado, respectivamente. O TLI não é normado, e, assim, 
seus valores podem ficar abaixo de O ou acima de 1. Ele pro- 
duz valores semelhantes ao CFI na maioria das situações. 


Proporção de parcimônia (PR) 


A proporção de parcimônia (PR) forma a base para medi- 
das GOF de parcimônia [31]: 


df 
PR=—+ 


t 


Como pode ser visto pela fórmula, ela é a razão de 
graus de liberdade usados por um modelo pelo total de 
graus de liberdade disponíveis. Assim, outros índices são 
ajustados por PR para formar índices de ajuste de par- 
cimônia. Apesar de esses índices poderem ser úteis, eles 
tendem a favorecer fortemente as medidas mais parcimo- 
niosas. Essas medidas existem há bastante tempo, mas 
ainda não são muito aplicadas. 
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CAPÍTULO 


SEM: Análise Fatorial Confirmatória 


Objetivos de aprendizagem 


Ao concluir este capítulo, você deverá ser capaz de: 
Diferenciar entre análise fatorial exploratória e análise fatorial confirmatória. 
m Avaliar a validade de construto de um modelo de mensuração. 
Saber como representar um modelo de mensuração usando um diagrama de caminhos. 
Entender os princípios básicos de identificação estatística e conhecer algumas das principais 
causas dos problemas de identificação de SEM. 
m (Compreender o conceito de ajuste da forma como se aplica em modelos de mensuração e 
ser capaz de avaliar o ajuste de um modelo de análise fatorial confirmatória. 


= Saber como a SEM pode ser usada para comparar resultados entre grupos, incluindo 
validação cruzada de um modelo de mensuração ao longo de amostras distintas. 


Apresentação do capítulo 


O capítulo anterior introduziu os fundamentos de modelagem de equações estruturais. Ele descreveu 
as duas partes básicas para um modelo de equações estruturais convencional. Este capítulo aborda 
a primeira parte, demonstrando como processos confirmatórios podem testar uma teoria proposta de 
mensuração. A teoria de mensuração pode ser representada com um modelo que mostra como variá- 
veis medidas se unem para representar construtos. A análise fatorial confirmatória (CFA) nos permite 
testar o quão bem as variáveis medidas representam os construtos. A principal vantagem é que o 
pesquisador pode testar analiticamente uma teoria conceitualmente fundamentada, explicando como 
diferentes itens medidos descrevem importantes medidas psicológicas, sociológicas ou de negócios. 
Quando resultados de CFA são combinados com testes de validade de construto, os pesquisadores 
podem obter um melhor entendimento da qualidade de suas medições. 

A importância de se avaliar a qualidade de medidas em um modelo comportamental não pode ser 
superestimada. Não existem conclusões válidas sem medidas válidas. Os procedimentos descritos 
neste capítulo demonstram como a validade de um modelo de mensuração pode ser testada usando- 
se CFA e SEM. 


Termos-chave 


Antes de começar este capítulo, leia os termos-chave para 
comprender os conceitos e a terminologia empregados. Ao 
longo do capítulo, os termos-chave aparecem em negrito. 
Outros pontos que merecem destaque no capítulo e referên- 
cias cruzadas nos termos-chave, estão em itálico. Exemplos 
ilustrativos estão em quadros. 


Busca de especificação Abordagem empírica de tentativa e 
erro que pode conduzir a mudanças sequenciais no modelo 
baseadas em diagnósticos-chave do modelo. 

Caso Heywood Solução fatorial que produz uma estimativa de 
variância de erro menor que O (uma variância negativa de 
erro). Programas SEM comumente geram uma solução impró- 
pria quando um caso Heywood está presente. 
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Condição de ordem Exigência de que os graus de liberdade 
para um modelo sejam maiores que zero; ou seja, o número 
de termos únicos de covariância e variância menos o número 
de estimativas de parâmetros livres deve ser positivo. 

Condição de ordenação Exigência de que cada parâmetro indi- 
vidual estimado seja única e algebricamente definido. Se você 
imagina um conjunto de equações que poderia definir qual- 
quer variável dependente, a condição de ordenação é violada 
se duas equações quaisquer são duplicatas matemáticas. 

Confiabilidade de construto (CR) Medida de confiabilidade e 
consistência interna das variáveis medidas representando um 
construto latente. Deve ser estabelecida antes que a validade 
do construto possa ser avaliada. 

Correlações quadráticas múltiplas Valores representando a 
extensão em que a variância de uma variável medida é expli- 
cada por um fator latente. É semelhante à idéia de comunali- 
dade em EFA. 

Covariância de erro entre construtos Covariância entre dois 
termos de erro de variáveis medidas indicando diferentes 
construtos. 

Covariância interna de erro de construto Covariância entre 
dois termos de erro de variáveis medidas que são indicadores 
de diferentes construtos. 

Equivalência de estrutura fatorial Às vezes conhecida como 
invariância de configuração, ela existe quando um bom ajuste 
é obtido de um modelo CFA multi-grupo que simultaneamente 
estima uma solução fatorial para todos os grupos, com cada 
grupo configurado com a mesma estrutura (mesmo padrão de 
parâmetros livres e fixados). Ver também modelo totalmente 
livre de múltiplos grupos. 

Equivalência escalar Condição de teoria da mensuração na 
qual as quantias de construtos podem ser comparadas entre 
grupos. Na prática, isso significa que uma comparação válida 
das médias entre grupos pode ser feita. 

Equivalência-tau Suposição de que um modelo de mensuração 
é congênere e que todas as cargas fatoriais são iguais. 

Exatamente identificado Modelo SEM que contém exatamente 
o número suficiente de graus de liberdade para estimar todos 
os parâmetros livres. Modelos exatamente identificados têm 
ajuste perfeito, por definição, o que significa que uma avalia- 
ção de ajuste não tem sentido. 

Identificação Se existe informação suficiente para identificar 
uma solução para um conjunto de equações estruturais. Um 
problema de identificação conduz a uma incapacidade de o 
modelo proposto gerar estimativas únicas e pode impedir que 
o programa SEM gere resultados. As três possíveis condições 
de identificação são super-identificado, exatamente identifica- 
do e sub-identificado. 

Índice de modificação Quantia em que o valor x? do modelo 
geral seria reduzido ao se livrar qualquer caminho em particu- 
lar que não seja correntemente estimado. 

Invariância de configuração Ver equivalência de estrutura fa- 
torial. 

Invariância de mensuração Condição de teoria de mensuração 
na qual as medidas que formam um modelo de mensuração 
têm o mesmo significado e são usadas da mesma maneira 
por diferentes grupos de respondentes. 


Invariância métrica Evidência de que respondentes usam as 
escalas de avaliação de maneira análoga ao longo de grupos 
e assim as diferenças entre valores podem ser diretamente 
comparadas. 

Medidas unidimensionais Conjunto de variáveis medidas 
(indicadores) com apenas um construto latente inerente. 
Isto é, as variáveis indicadoras carregam sobre apenas um 
construto. 

Modelo de mensuração Especificação da teoria de mensura- 
ção que mostra como construtos são operacionalizados por 
conjuntos de variáveis medidas. A especificação é semelhan- 
te a uma EFA por análise fatorial, mas difere no sentido de que 
o número de fatores e itens que carregam sobre cada fator 
devem ser conhecidos e especificados antes que a análise 
possa ser conduzida. 

Modelo de mensuração congênere Modelo de mensuração 
consistindo de diversos construtos unidimensionais com to- 
das as cargas cruzadas sendo consideradas nulas. Isso é re- 
presentado em CFA com todas as covariâncias de erro interno 
e entre construtos sendo fixadas como zero. 

Modelo fatorial de primeira ordem Covariâncias entre variáveis 
medidas explicadas com uma única camada fatorial latente. 
Ver também modelo fatorial de segunda ordem, que tem duas 
camadas de fatores latentes. 

Modelo fatorial de segunda ordem Teoria de mensuração que 
envolve duas “camadas” de construtos latentes. Esses mode- 
los introduzem fatores latentes de segunda ordem que são a 
causa de múltiplos fatores latentes de primeira ordem, que, 
por sua vez, são a causa de variáveis medidas (x). 

Modelo não-identificado Ver modelo sub-identificado. 

Modelo sub-identificado Modelo com mais parâmetros a se- 
rem estimados do que variâncias ou covariâncias de itens. 
O termo não-identificado é usado como sinônimo de sub- 
identificado. 

Modelo super-identificado Modelo que tem mais termos únicos 
de covariância e variância do que parâmetros a serem estima- 
dos. Ele tem uma quantia positiva de graus de liberdade. Este 
é o tipo preferido de identificação para um modelo SEM. 

Modelo totalmente livre de múltiplos grupos (TF) Modelo que 
usa a mesma estrutura (padrão de parâmetros fixos e livres) 
em todos os grupos. 

Operacionalização Maneira pela qual um construto pode ser 
representado. Com CFA, um conjunto de variáveis medidas é 
utilizado para representar um construto. 

Parâmetro Representação numérica de alguma característica 
de uma população. Em SEM, relações são a característica 
de interesse para as quais os procedimentos de modelagem 
geram estimativas. Parâmetros são características numéricas 
das relações SEM, comparáveis com coeficientes de regres- 
são em regressão múltipla. 

Parcelamento de item Combinação de variáveis medidas em 
conjuntos de variáveis pela soma ou média de vários itens. 
Essas parcelas podem então ser usadas como indicadores 
quando o número total de indicadores não é gerenciável. 

Regra dos três indicadores Assume modelos de mensuração 
congêneres nos quais todos os construtos têm pelo menos 
três indicadores identificados. 
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Resíduos padronizados Resíduos divididos pelo erro padrão 
dos mesmos. Usados como uma medida diagnóstica do ajus- 
te do modelo. 

Resíduos Diferenças individuais entre termos de covariância 
observada e termos de covariância estimada. 

Restrições Fixar uma relação potencial em um modelo SEM 
para algum valor especificado (mesmo que seja zero) ao in- 
vés de permitir que o valor seja estimado (livre). 

Teoria de mensuração Série de relações que sugerem como 
variáveis medidas representam um construto não medido di- 
retamente (latente). Uma teoria de mensuração pode ser re- 
presentada por uma série de equações do tipo regressão e 
que matematicamente relacionam um fator (construto) com as 
variáveis medidas. 

Teoria de mensuração formativa Teoria baseada nas su- 
posições de que (1) as variáveis medidas são a causa do 
construto e (2) o erro na medição é uma falta de habilidade 
para explicar completamente o construto. O construto não 
é latente neste caso. Ver também teoria de mensuração re- 
flexiva. 

Teoria de mensuração reflexiva Teoria baseada nas suposi- 
ções de que (1) construtos latentes são a causa de variáveis 
medidas e (2) o erro de medição resulta da incapacidade de 
explicar completamente tais medidas. É a representação típi- 
ca para um construto latente. Ver também teoria de mensura- 
ção formativa. 

TF Ver modelo totalmente livre de múltiplos grupos. 

Validação cruzada Tentativa de reproduzir os resultados encon- 
trados em alguma amostra usando dados de uma amostra di- 
ferente, geralmente obtidos da mesma população. 

Validação cruzada apertada Obtida quando as cargas fato- 
riais, correlações de construtos e termos de variância de erro 
são os mesmos na amostra original como são nas amostras 
de validação cruzada. 

Validação cruzada solta Obtida quando um modelo TF com- 
posto de uma amostra original e de uma amostra de validação 
cruzada fornece bom ajuste. 

Validade convergente O quanto indicadores de um construto 
específico convergem ou compartilham uma elevada propor- 
ção de variância em comum. 

Validade de construto O quanto um conjunto de variáveis me- 
didas realmente representa o construto latente teórico que 
aquelas variáveis são planejadas para medir. 

Validade de expressão O quanto o conteúdo dos itens é con- 
sistente com a definição do construto, com base apenas no 
julgamento do pesquisador. 

Validade discriminante O quanto um construto é verdadeira- 
mente distinto de outros. A matriz fi (&) de correlações de 
construtos pode ser útil nesta avaliação. 

Validade nomológica Teste de validade que examina se as cor- 
relações entre os construtos na teoria de mensuração fazem 
sentido. A matriz fi (4) de correlações de construtos pode ser 
útil nesta avaliação. 

Variância extraída (VE) Uma medida resumida de convergên- 
cia em um conjunto de itens que representa um construto 
latente. É o percentual médio de variação explicada entre 
os itens. 


Viés de métodos constantes Covariância entre variáveis medi- 
das é influenciada pelo método de coleta de dados (p.ex., o 
mesmo método de coleta, formato do questionário, ou mesmo 
tipo de escala). 


O QUE É ANÁLISE FATORIAL 
CONFIRMATÓRIA? 


Este capítulo começa fornecendo uma descrição de aná- 
lise fatorial confirmatória (CFA). CFA é uma maneira 
de testar o quão bem variáveis medidas representam 
um número menor de construtos. O capítulo ilustra este 
processo mostrando como a CFA é parecida com outras 
técnicas multivariadas. Em seguida, um exemplo simples 
é dado. Uns poucos aspectos importantes da CFA são 
discutidos antes de se descrever os estágios da CFA com 
mais detalhes e demonstrar tal técnica com uma ilustra- 
ção estendida. 


CFA e análise fatorial exploratória 


O Capítulo 3 descreveu procedimentos para conduzir 
análise fatorial exploratória (EFA). A EFA explora os 
dados e fornece ao pesquisador informação sobre quan- 
tos fatores são necessários para melhor representar os 
dados. Com EFA, todas as variáveis medidas são rela- 
cionadas com cada fator por uma estimativa de carga 
fatorial. Uma estrutura simples resulta quando cada 
variável medida carrega muito sobre apenas um fator e 
tem cargas menores sobre outros fatores (isto é, cargas 
< 0,4). 


No Capítulo 3, EFA foi conduzida sobre 13 variáveis do 
banco de dados da HBAT. Com base nos auto-valores e 
no padrão das cargas, uma solução de quatro fatores foi 
considerada a mais adequada. Os quatro fatores foram 
nomeados com base nas variáveis que carregam bastante 
sobre cada fator. Usando este processo, os fatores foram 
chamados de (1) serviço ao cliente, (2) marketing, (3) 
suporte técnico e (4) valor do produto (ver Capítulo 3 
para mais detalhes). 


A característica notável de EFA é que os fatores fo- 
ram derivados de resultados estatísticos e não de teoria, 
e assim eles somente podem ser nomeados depois que a 
análise fatorial é executada. A EFA pode ser conduzida 
sem que se saiba quantos fatores realmente existem ou 
quais variáveis pertencem a quais construtos. Neste con- 
texto, CFA e EFA não são a mesma técnica. Observe que 
neste capítulo os termos fator e construto são usados como 
sinônimos. 

A análise fatorial confirmatória (CFA) é semelhante 
à EFA em alguns aspectos, mas filosoficamente é muito 
diferente. Com a CFA, o pesquisador deve especificar o 
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número de fatores que existem dentro de um conjunto de 
variáveis e sobre qual fator cada variável irá carregar ele- 
vadamente antes que resultados possam ser computados. 
A técnica não designa variáveis a fatores. Ao invés disso, 
o pesquisador deve ser capaz de fazer essa designação an- 
tes que quaisquer resultados possam ser obtidos. SEM é 
então aplicada para testar o grau em que o padrão a prio- 
ri de cargas fatoriais do pesquisador representa os dados 
reais. Assim, ao invés de permitir que o método estatístico 
determine o número de fatores e cargas, como em EFA, 
a estatística de CFA nos diz o quão bem nossa especifica- 
ção dos fatores combina com a realidade (os dados ver- 
dadeiros). Em um certo sentido, CFA é uma ferramenta 
que nos permite confirmar ou rejeitar nossa teoria pré- 
concebida. 

CFA é usada para fornecer um teste confirmatório de 
nossa teoria de mensuração. Modelos SEM fregiiente- 
mente envolvem uma teoria de mensuração e uma teoria 
estrutural. Uma teoria de mensuração especifica como 
variáveis medidas representam lógica e sistematicamen- 
te construtos envolvidos em um modelo teórico. Em 
outras palavras, a teoria de mensuração especifica uma 
série de relações que sugerem como variáveis medidas 
representam um construto latente que não é diretamente 
medido. 

A teoria de mensuração demanda que um construto 
seja primeiramente definido. Portanto, diferentemente da 
EFA, com a CFA um pesquisador usa teoria de mensu- 
ração para especificar a priori o número de fatores, bem 
como quais variáveis carregam sobre tais fatores. Esta 
especificação é frequentemente referida como a maneira 
que os construtos conceituais em um modelo de mensura- 
ção são operacionalizados. CFA não pode ser conduzida 
sem uma teoria de mensuração. Em EFA, não é necessá- 
ria tal teoria e nem a habilidade de se definir construtos 
antecipadamente. 


Um exemplo simples de CFA e SEM 


Agora vamos ilustrar uma CFA simples, utilizando dois 
construtos do exemplo primeiramente introduzido no 
Capítulo 10. Discutiremos agora como a teoria de men- 
suração é representada em um diagrama de caminhos e 
na notação mais formal com letras gregas empregadas em 
SEM. 


Considere uma situação na qual um pesquisador está in- 
teressado em estudar lealdade de clientes. Após rever a 
teoria relevante, o pesquisador conclui que lealdade de 
clientela é formada por dois fatores: gastos de clientes e 
envolvimento de clientes. O construto gastos de Clientes 
pode ser definido como a quantia relativa de recursos 
que um cliente gasta com uma marca, entre diversas al- 
ternativas concorrentes. Ele pode ser representado pelos 
seguintes quatro itens: 


e De cada R$ 100,00 que você gasta com 
to você investe na marca X? 

e Quando você pensa em 
cia você pensa na marca X? 

e De cada dez vezes que você usa um 
que freqiiência você usa a marca X? 

e Quanto você espera gastar na marca X no próximo ano? 


+ quan- 
, com qual fregiiên- 


, com 


O construto Compromisso de Cliente pode ser defi- 
nido como o grau em que um cliente fica emocionalmen- 
te envolvido e disposto a se sacrificar por uma marca. 
Assim, o construto Compromisso de Cliente pode ser 
representado por quatro variáveis medidas avaliadas 
usando-se uma escala de Likert de sete pontos do tipo 
concordo-discordo: 


e Estou disposto a fazer um esforço para obter a marca X. 

º Eume sentiria desconfortável usando uma marca que 
compete com a X. 

e Sinto orgulho de dizer aos meus amigos que compro a 
marca X. 

e Eu continuaria a comprar a marca X mesmo que ela 
custasse mais do que todas as suas concorrentes. 


Um diagrama visual 

Teorias de mensuração com fregiiência são representadas 
usando-se diagramas visuais.Os diagramas representam 
visualmente os modelos teóricos testados usando técni- 
cas de SEM como LISREL, AMOS, EQS ou CALIS. Os 
caminhos do construto latente para os itens medidos são 
mostrados com as setas. Cada caminho representa uma 
relação ou carga que deve existir com base na teoria de 
mensuração. Usando CFA, apenas as cargas que teorica- 
mente conectam um item medido ao seu correspondente 
fator latente são calculadas. Todas as demais são assumi- 
das como nulas, uma diferença fundamental entre EFA e 
CFA. Lembre-se que técnicas EFA produzem uma carga 
para cada variável sobre cada fator. 


A teoria de mensuração que descreve o construto Com- 
promisso de Cliente pode ser representada como se mos- 
tra na Figura 11-1. Observe que a teoria de mensuração 
representada neste diagrama sugere que os itens que 
correspondem aos gastos de clientes não carregam sobre 
o fator de Compromisso de clientes e vice-versa. 


Em notação SEM comum, construtos são represen- 
tados por letras gregas e variáveis medidas por letras ro- 
manas. O Apêndice 10B inclui uma breve lista e um guia 
de pronúncia para caracteres gregos frequentemente em- 
pregados como abreviações de SEM. Em CFA, as desig- 
nações mais comuns são construtos latentes (É), variáveis 
medidas (x), relações entre os construtos latentes e as res- 
pectivas variáveis medidas (isto é, cargas fatoriais) (1), 
e erro (8), que é o grau em que fator latente não explica 
a variável medida (semelhante ao conceito de 1 — a co- 
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munalidade de item discutida no Capítulo 3). Com CFA, 
não distinguimos, e nem precisamos distinguir, constru- 
tos exógenos de endógenos. No programa SEM, todos os 
construtos são tratados como sendo do mesmo tipo (ou 
todos exógenos [mais comuns], ou todos endógenos). 


Na Figura 11-1, é representa o construto latente Gastos 
de Cliente, E, corresponde ao construto latente Compro- 
misso de Cliente, x, — x, se referem às variáveis medidas, 
Aa17 Àvg> representam as relações entre os construtos 
latentes e os respectivos itens medidos (ou seja, cargas 
fatoriais), e d,—ô, É O erro. 


Programas SEM, incluindo AMOS e LISREL, se refe- 
rem a essas representações visuais como diagramas de ca- 
minhos. A convenção é que setas apontam de uma causa 
para um resultado. Construtos são considerados como a 
causa de variáveis medidas. Setas de dois sentidos repre- 
sentam covariância não-causal por natureza. 


Expressão com equações 
Em forma matemática, a teoria de mensuração pode ser 
representada por uma série de equações da forma: 


M =A1 14 + 


Esta equação é semelhante a uma equação de regres- 
são típica. Lembre do Capítulo 4, no qual apresentamos a 
equação de regressão como: 


K =b +hV, RE, 


Os símbolos a seguir substituem aqueles que se torna- 
ram familiares no Capítulo 4. O símbolo à, ,, (como b,) 
representa a relação entre o fator latente E (como V,) e a 
variável medida que ele explica (x,). Como ele não a re- 
presenta perfeitamente, ô, representa o erro resultante (ou 
seja, e,). Como ocorre em análise de regressão, as técnicas 
SEM fornecem estimativas de parâmetros. Um parâmetro 


Do; 


Gastos 
de Cliente 


Compromisso 
de Cliente 


ô, d dad 3 de 


FIGURA 11-1 Representação visual (diagrama de caminhos) de 
uma teoria de mensuração. 


é uma representação numérica de alguma característica de 
uma população. Em SEM, essas características são rela- 
ções. Uma estimativa de parâmetro para a relação entre 
um construto e uma variável medida (A) é de particular 
interesse. Em CFA, à estima uma carga fatorial. Diferen- 
temente de regressão, esta equação SEM em particular é 
apenas uma de várias necessárias para estimar um modelo 
SEM completo. É a equação fundamental em CFA. 


Resumo 

Em CFA, não é necessário distinguir construtos exógenos 
de endógenos ou variáveis independentes de dependen- 
tes. Nesse sentido, ela é uma técnica de interdependência. 
Portanto, a equação explica as variáveis x com um fator 
latente (E). Poderíamos expressar cada variável medida 
com um y, e os fatores latentes, com um m. No entanto, 
é mais comum representar um modelo de mensuração 
usando x para abreviar as variáveis medidas, e E para re- 
presentar os construtos. 


CFA e validade de construto 


Lembre que, no Capítulo 3, validade foi definida como o 
grau em que a pesquisa é precisa, e a discussão se concen- 
trou na validação de escalas múltiplas. Frequentemente, 
a CFA elimina a necessidade de escalas múltiplas, pois 
os programas SEM computam escores fatoriais para cada 
respondente. Este processo permite que relações entre 
construtos sejam automaticamente corrigidas quanto à 
quantia de variância de erro que existe nas medidas de 
construto. 

Uma das maiores vantagens de CFA/SEM é sua habi- 
lidade para avaliar a validade de construto de uma teoria 
de mensuração proposta. Validade de construto é o grau 
em que um conjunto de itens medidos realmente reflete o 
construto latente teórico que aqueles itens devem medir. 
Assim, ela lida com a precisão de mensuração. Evidência 
de validade de construto oferece segurança de que me- 
didas tiradas de uma amostra representam o verdadeiro 
escore que existe na população. 

Validade de construto é formada por quatro compo- 
nentes importantes. Tais componentes foram introdu- 
zidos no Capítulo 3 juntamente com escalas múltiplas. 
Aqui, expandimos essas idéias e as discutimos em termos 
mais adequados para CFA. 


Validade convergente 

Os itens que são indicadores de um construto específico 
devem convergir ou compartilhar uma elevada proporção 
de variância em comum, conhecida como validade con- 
vergente. Há diversas maneiras de estimar a quantia rela- 
tiva de validade convergente entre medidas de itens. 


Cargas fatoriais. O tamanho da carga fatorial é uma 
consideração importante. No caso de elevada validade 
convergente, cargas altas sobre um fator indicariam que 
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elas convergem para algum ponto em comum. No míni- 
mo, todas as cargas fatoriais devem ser estatisticamente 
significantes [1]. Como uma carga significante poderia 
ainda ser relativamente fraca, uma boa regra prática é que 
estimativas de cargas padronizadas devem ser de 0,5 ou 
mais, e idealmente de 0,7 para cima. 

O argumento por trás dessa regra pode ser compreen- 
dido no contexto da comunalidade de um item (ver Ca- 
pítulo 3). O quadrado de uma carga fatorial padronizada 
representa o tanto de variação em um item que é expli- 
cado por um fator latente. Assim, uma carga de 0,71 ao 
quadrado é igual a 0,5. Resumidamente, o fator está ex- 
plicando metade da variação no item, com a outra metade 
correspondendo à variância de erro. Quando cargas ficam 
abaixo de 0,7, elas ainda podem ser consideradas signi- 
ficantes, mas há mais variância de erro do que variância 
explicada na variância da medida. 


Variância extraída. Com CFA, o percentual médio de 
variância extraída (VE) em um conjunto de itens de cons- 
trutos é um indicador resumido de convergência [23]. Este 
valor pode ser calculado simplesmente usando-se cargas 
padronizadas: 


n 


O à representa a carga fatorial padronizada e i é o 
número de itens. Assim, para n itens, VE é calculada 
como o total de todas as cargas fatoriais padronizadas 
ao quadrado (correlações múltiplas quadradas) dividido 
pelo número de itens. Em outras palavras, é a carga fa- 
torial quadrática média. Usando essa mesma lógica, uma 
VE de 0,5 ou mais é uma boa regra sugerindo conver- 
gência adequada. Uma VE inferior a 0,5 indica que, em 
média, mais erro permanece nos itens do que variância 
explicada pela estrutura fatorial latente imposta sobre a 
medida. Uma medida de VE deve ser computada para 
cada construto latente em um modelo de mensuração. 
Na Figura 11-1, uma estimativa de VE é necessária tanto 
para o construto Gastos de Cliente quanto para Compro- 
misso de Cliente. 

Na maioria dos casos, os pesquisadores devem in- 
terpretar estimativas padronizadas de parâmetros. Pro- 
gramas SEM geralmente fornecem essas estimativas, 
apesar de esta ser usualmente uma opção que deva ser 
solicitada. 


Confiabilidade. Confiabilidade também é um indicador 
de validade convergente. Há um considerável debate sobre 
qual seria a melhor alternativa de estimativa de confiabilida- 


1 . 5 . da 
Programas SEM oferecem diferentes tipos de padronização. Quando 
usamos o termo padronizado, estamos nos referindo a estimativas 
completamente padronizadas, a menos que digamos o contrário. 


de [5]. O coeficiente alfa ainda é uma estimativa freguente- 
mente aplicada, apesar de ele poder subestimar confiabilida- 
de. Diferentes coeficientes de confiabilidade não produzem 
resultados dramaticamente distintos, mas um valor de con- 
fiabilidade de construto (CR) ligeiramente diferente é usa- 
do com fregiiência em parceria com modelos SEM. Ele é 
facilmente computado a partir do quadrado da soma de car- 
gas fatoriais (X,) para cada construto e a partir da soma dos 
termos de variância de erro para um construto (ô,): 


2 


CR = 


A regra para qualquer estimativa de confiabilidade é 
que 0,7 ou mais sugere um bom valor. Confiabilidade en- 
tre 0,6 e 0,7 pode ser aceitável desde que outros indicado- 
res de validade de construto de um modelo sejam bons. 
Elevada confiabilidade de construto indica a existência 
de consistência interna, o que significa que todas as me- 
didas consistentemente representam o mesmo construto 
latente. 


Validade discriminante 

Validade discriminante é o grau em que um construto é 
verdadeiramente diferentes dos demais. Logo, valida- 
de discriminante elevada oferece evidência de que um 
construto é único e captura alguns fenômenos que outras 
medidas não conseguem. A CFA fornece duas maneiras 
usuais de avaliar validade discriminante. 


e Primeiro, a correlação entre dois construtos quaisquer 
pode ser especificada (fixada) como sendo 1. Essencial- 
mente, isto é o mesmo que especificar que os itens que 
compõem dois construtos poderiam perfeitamente compor 
apenas um. Se o ajuste do modelo de dois construtos não 
for significantemente melhor do que o de um construto, 
então a validade discriminante é insuficiente [1, 6]. Na prá- 
tica, porém, este teste nem sempre oferece forte evidência 
de validade discriminante, pois elevadas correlações, às 
vezes na faixa de 0,9, ainda podem produzir diferenças sig- 
nificantes no ajuste. 


Como mostrado na Figura 11-1, o pesquisador poderia 
examinar um modelo que exibisse todos os itens medi- 
dos como indicadores de apenas um construto latente. O 
pesquisador poderia testar um modelo com esta especi- 
ficação e comparar seu ajuste com o do modelo original, 
sugerindo que os itens correspondem a dois construtos 
separados. 


* Umteste melhor é comparar os percentuais de variância ex- 
traída para dois construtos quaisquer com o quadrado da 
estimativa de correlação entre tais construtos [23]. As es- 
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timativas da variância extraída devem ser maiores do que 
a estimativa quadrática de correlação. O argumento aqui é 
baseado na idéia de que um construto latente deve expli- 
car suas medidas de itens melhor do que outro construto. 
O êxito neste teste fornece boa evidência de validade dis- 
criminante. 


Além da diferenciação entre construtos, validade dis- 
criminante também significa que itens individuais medi- 
dos devem representar somente um construto latente. A 
presença de cargas cruzadas indica um problema de vali- 
dade discriminante. Se elevadas cargas cruzadas de fato 
existem, e elas não são representadas pelo modelo de 
mensuração, o ajuste CFA não deve ser bom. 


Validade nomológica e validade de expressão 
Construtos devem também ter validade de expressão e va- 
lidade nomológica. Os processos para testar tais proprie- 
dades são os mesmos em CFA ou EFA, portanto o leitor 
deve consultar o Capítulo 3 para um esclarecimento mais 
detalhado. Validade nomológica é testada examinando- 
se se fazem sentido as correlações entre os construtos 
em uma teoria de mensuração. A matriz de correlações 
de construtos pode ser útil nesta avaliação. Além disso, 
acrescenta-se o fato de que validade de expressão deve 
ser estabelecida antes de qualquer teste teórico, quando 
se usa CFA. Sem uma compreensão sobre o conteúdo ou 
significado de cada item, fica impossível expressar e es- 
pecificar corretamente uma teoria de mensuração. Assim, 
sob um ponto de vista realista, validade de expressão é o 
mais importante teste de validade. 

Pesquisadores frequentemente testam uma teoria de 
mensuração usando construtos medidos por múltiplas es- 
calas desenvolvidas em pesquisa prévia. Por exemplo, se 
a HBAT desejasse medir satisfação de cliente com seus 
serviços, ela poderia fazer isso avaliando e selecionando 
uma entre diversas escalas de satisfação de clientela na 
literatura de marketing. Existem manuais em muitas dis- 
ciplinas de ciências sociais que catalogam escalas de múl- 
tiplos itens [8, 47]. Analogamente, se a HBAT quisesse 


REGRAS PRÁTICAS 11-1 


Validade de construto 


Estimativas de cargas padronizadas devem ser de 0,5 ou 
mais, e, idealmente, maiores ou iguais a 0,7 

VE deve ser maior ou igual a 0,5 para sugerir validade 
convergente adequada 


Estimativas de VE para dois fatores também devem 
ser maiores do que o quadrado da correlação entre 
os dois fatores, para fornecer evidência de validade 
discriminante 


Confiabilidade de construto deve ser de 0,7 ou mais, 
para indicar convergência adequada ou consistência 
interna 


examinar a relação entre dissonância cognitiva e satisfa- 
ção de clientes, poderia ser usada uma escala de dissonân- 
cia cognitiva anteriormente aplicada. 

Sempre que escalas previamente utilizadas estiverem 
no mesmo modelo, mesmo que elas tenham sido aplica- 
das com sucesso com adequada confiabilidade e valida- 
de em outra pesquisa, o pesquisador deve prestar muita 
atenção para que o conteúdo do item das escalas não se 
sobreponha. Em outras palavras, quando se usam escalas 
emprestadas, o pesquisador ainda deve verificar validade 
de expressão. É muito provável que, quando duas escalas 
emprestadas são usadas juntas em um único modelo de 
mensuração, as questões de validade de expressão se tor- 
nam evidentes — coisa que não era percebida quando as 
escalas eram usadas individualmente. 


Resumo 

A análise fatorial confirmatória é um tipo especial de aná- 
lise fatorial e é a primeira parte de um teste completo de 
um modelo estrutural. Diferentemente da EFA, o pes- 
quisador deve ser capaz de dizer ao programa SEM quais 
variáveis pertencem a quais fatores antes que a análise 
possa ser conduzida. A CFA não apenas deve fornecer 
ajuste aceitável, mas também deve mostrar evidência de 
validade de construto. Quando um modelo CFA se ajusta 
e demonstra validade de construto, a teoria de mensura- 
ção é sustentada. 


ESTÁGIOS SEM PARA TESTAR 
VALIDAÇÃO DA TEORIA 
DE MEDIDA COM CFA 


Uma teoria de medida é usada para especificar como 
conjuntos de itens medidos representam um conjunto de 
construtos. As relações fundamentais conectam constru- 
tos com variáveis (através de estimativas de cargas ou À) 
e construtos entre si (correlação de construtos ou &). A 
CFA então estima essas relações. Um processo SEM de 
seis estágios foi apresentado no último capítulo. Os está- 
gios 1-4 serão discutidos com mais detalhes aqui porque 
eles envolvem o exame da teoria de mensuração. Os está- 
gios 5-6, que tratam da teoria estrutural que liga teorica- 
mente os construtos entre si, serão discutidos no próximo 
capítulo. 


Estágio 1: Definição de construtos individuais 


O processo começa listando os construtos que compreen- 
derão o modelo de mensuração. Se o pesquisador tem ex- 
periência com a medição de um desses construtos, então 
talvez alguma escala anteriormente usada possa ser nova- 
mente empregada. A literatura contém muitas escalas que 
mostram como um conjunto de itens pode representar um 
construto [8, 47]. Quando uma escala previamente utili- 
zada não está disponível, o pesquisador pode ter que de- 
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senvolver uma escala como descrito no Capítulo 10. Uma 
breve descrição dos passos no desenvolvimento de uma 
escala de múltiplos itens é dada aqui: 


1. Definir teoricamente o construto. Para fazer isso, o pesqui- 
sador deve ser capaz de escrever uma sentença clara e con- 
cisa que defina o que será medido. 

2. Desenvolver uma lista de potenciais itens de escala que 
correspondam à definição no passo 1. Os itens devem ser 
suficientes em quantia para capturar completamente o do- 
mínio do construto. Pesquisa qualitativa frequentemente é 
usada para desenvolver itens de escala para representarem 
o domínio do construto. O pesquisador deve também de- 
terminar qual tipo de escala será usado para medir os itens. 
Será em um formato Likert, diferencial semântico, alguma 
combinação, ou um formato alternativo? 

3. Julgar os itens quanto a conteúdo. Este processo envolve 
solicitar a vários juízes (peritos) para avaliar o quão bem a 
definição e os itens correspondem ao construto. Algumas 
maneiras de abordar este passo incluem as seguintes: 


e Uma escala de avaliação pode ser usada para solicitar 
aos peritos que classifiquem se cada item de escala (a) 
não corresponde ao construto, (b) corresponde de al- 
guma forma ao construto, ou (c) corresponde muito 
bem ao construto. Alternativamente, se diversos cons- 
trutos estão sendo julgados ao mesmo tempo, peritos 
podem ser solicitados a ordenar um conjunto de itens, 
relacionando-os com as definições apropriadas. Em 
termos gerais, itens que obtêm concordância de cada 
um dos três ou mais peritos correspondem o suficiente 
para serem mantidos. Independentemente do número 
de juízes usados, itens que recebem menos do que 50% 
de concordância são candidatos para exclusão da aná- 
lise. 

e Peritos também podem examinar itens quanto à redun- 
dância. Se dois itens são tão semelhantes a ponto de di- 
zerem a mesma coisa, um item deve ser eliminado. Tal 
eliminação ajudará a evitar problemas posteriores com 
os resultados empíricos. 


4. Conduzir um pré-teste para avaliar os itens. O pré-teste 
deve ser administrado para uma amostra que deve respon- 
der analogamente às amostras sobre as quais a escala even- 
tualmente será aplicada. 


e Depois de coletar os dados, estatísticas descritivas de- 
vem ser analisadas quanto à curtose ou à assimetria sig- 
nificantes. Escalas com médias próximas de seus valores 
mínimo ou máximo podem estar sofrendo efeitos de 
“piso” ou “teto”, e são candidatas para modificação ou 
eliminação. 

e Escalas múltiplas podem ser criadas, e as correlações en- 
tre itens e total e entre item e item podem ser analisadas. 
Itens com correlações entre itens e total e entre itens e 
itens inferiores a 0,5 e 0,3, respectivamente, são candida- 
tos à eliminação. 

e Análise fatorial exploratória pode ser executada para 
fornecer uma verificação preliminar sobre o número de 
fatores e o padrão de cargas. Se é esperado que os itens 
de carga indiquem uma só dimensão, evidências supor- 
tando uma solução de um fator devem ser examinadas, 


por exemplo, por meio de um critério de raiz latente 
(autovalor > 1) ou uma abordagem semelhante. Se mais 
fatores são esperados, então a análise fatorial deve exibir 
alguma evidência de que este número de fatores pode ser 
sustentado. Cargas fatoriais individuais também devem 
ser examinadas. Itens com cargas baixas são candidatos 
à eliminação. 

5. Modificações de escala são feitas com base nesses resulta- 
dos. Antes de prosseguir, o pesquisador deve considerar se 
existe um número adequado de itens para cada fator. Uma 
regra prática é que um construto deve ser refletido por um 
mínimo de três itens, preferencialmente quatro. Recipro- 
camente, nenhum máximo teórico põe limite no número 
de itens por fator. Contudo, escalas contendo mais de uma 
dúzia de itens tornam a análise mais complexa e freqiiente- 
mente conduzem a problemas no fornecimento de evidência 
de unidimensionalidade. 

6. Prosseguir com um teste confirmatório da teoria de mensu- 
ração (ver estágio 2 na próxima seção). 


O processo de planejamento de medida de um novo 
construto envolve vários passos por meio dos quais o pes- 
quisador traduz a definição teórica do construto em um 
conjunto de variáveis medidas específicas. Como tal, é es- 
sencial que o pesquisador considere não apenas as exigên- 
cias operacionais (como número de itens e dimensionali- 
dade), mas também estabeleça a validade de construto da 
escala recentemente delineada. 


Estágio 2: Desenvolvimento do 
modelo de medida geral 


Neste passo o pesquisador deve cuidadosamente conside- 
rar como todos os construtos individuais se reúnem para 
formar um modelo de mensuração geral. Várias questões 
importantes devem ser destacadas neste ponto. 


REGRAS PRÁTICAS 11-2 


Definição de construtos individuais 


e Todos os construtos devem exibir validade adequada, 
sejam novas escalas ou escalas obtidas de pesquisa 
prévia; mesmo escalas previamente estabelecidas 
devem ser cuidadosamente verificadas quanto a 
validade de conteúdo 
Peritos devem julgar o conteúdo de itens quanto a 
validade nos estágios iniciais de desenvolvimento de 
escala 
e Quando dois itens têm conteúdo virtualmente 

idêntico, um deles deve ser eliminado 
e Itens sobre os quais os peritos não conseguem 
concordar devem ser eliminados 
Um pré-teste deve ser usado para purificar medidas 
antes do teste confirmatório 
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Unidimensionalidade 

Unidimensionalidade foi primeiramente apresentada no 
Capítulo 3. Medidas unidimensionais significam que um 
conjunto de variáveis medidas (indicadores) tem apenas 
um construto subjacente. Unidimensionalidade se torna 
criticamente importante quando mais de dois construtos 
estão envolvidos. Em tal situação, cada variável medida se 
relaciona com apenas um único construto. Todas as cargas 
cruzadas são consideradas como sendo O quando existem 
construtos unidimensionais. 


A Figura 11-1 presume dois construtos unidimensionais, 
pois nenhum item medido é determinado por mais de 
um construto (tem mais do que uma seta de um constru- 
to latente para ele). Em outras palavras, todas as cargas 
cruzadas são fixadas em 0. 


Um tipo de relação entre variáveis que impacta uni- 
dimensionalidade é quando pesquisadores permitem que 
uma única variável medida seja causada por mais de um 
construto. Esta situação é representada no modelo de ca- 
minhos por setas que partem de um construto para va- 
riáveis indicadoras associadas com construtos separados. 
Lembre-se que o pesquisador está procurando por um 
modelo que produza um bom ajuste. Quando se liberta 
outro caminho em um modelo a ser estimado, o valor do 
caminho estimado só pode tornar o modelo mais preciso. 
Ou seja, a diferença entre as matrizes de covariância es- 
timada e observada (X, — S) é reduzida, a menos que as 
duas variáveis sejam completamente não-correlacionadas. 
Portanto, a estatística x” será quase sempre reduzida pela 
liberação de caminhos adicionais. 


A Figura 11-2 é semelhante ao modelo original, com a 
exceção de que diversas relações adicionais são assumi- 
das. Em contraste com o modelo original de mensura- 
ção, este não é considerado unidimensional. Relações 
adicionais são assumidas entre x,, uma variável medida, 
e o construto latente Compromisso de Cliente (£,), e en- 
tre x, e o construto latente Gastos de Cliente (E). Essas 
relações são representadas por À,,, € A,s, Tespectiva- 
mente. Logo, a variável indicadora x, de gastos de clien- 
te e a variável indicadora x, de compromisso de cliente 
são consideradas com cargas sobre ambos os construtos 
latentes. 


Como regra, mesmo que a adição desses caminhos leve 
a um ajuste significativamente melhor, o pesquisador não 
deve liberar (teorizar) cargas cruzadas. Por quê? Porque 
a existência de cargas cruzadas significantes é evidência 
de uma falta de validade de construto. Quando uma carga 
cruzada significante é descoberta, a validade menor é evi- 
denciada em melhor ajuste. Quando cargas cruzadas são 
estimadas, qualquer melhora potencial de ajuste é artifi- 


cial, no sentido de que é obtida com a admissão de uma 
correspondente falta de validade de construto. 

Outra forma de relações entre variáveis é a cova- 
riância entre termos de erro de duas variáveis medidas. 
Dois tipos de covariância entre termos de erro incluem 
a covariância entre termos de erro de itens que indicam 
o mesmo construto, conhecida como covariância inter- 
na de erro de construto. O segundo tipo é covariância 
entre dois termos de erro de itens indicando diferentes 
construtos, conhecida como covariância de erro entre 
construtos. 


A Figura 11-2 mostra também covariância entre alguns 
dos termos de erro. 0,,, é a covariância entre as variá- 
veis medidas x, e x, (ou seja, covariância interna de erro 
de construto). Podemos também perceber covariância 
entre dois termos de erro de itens que indicam constru- 
tos distintos. Aqui, 0,,, é um exemplo de covariância de 
erro entre construtos envolvendo as variáveis medidas 
x, Cx. 


Liberar esses caminhos pode apenas reduzir o x” ou 
deixá-lo igual. Quanto maiores ficam essas estimativas de 
relação, mais os resultados sugerem problemas com vali- 
dade de construto, particularmente no caso de correlações 
entre construtos. Covariâncias significantes de erro entre 
construtos sugerem que os dois itens associados com esses 
termos de erro são mais altamente relacionados entre si 
do que o modelo de mensuração original prevê. Esta é ou- 
tra maneira de sugerir que existe uma carga cruzada signi- 
ficante, o que também denuncia uma falta de validade dis- 
criminante. Assim, novamente, apesar de esses caminhos 
poderem ser liberados e melhorarem o ajuste do modelo, 
fazer isso viola as suposições de boa mensuração. 

Logo, não recomendamos a liberação de qualquer 
tipo de caminho na maioria das aplicações de CFA. Em 
situações relativamente raras e específicas, os pesquisa- 


5, 3 Ba da Bs % 3 3 
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FIGURA 11-2 Modelo de mensuração com cargas cruzadas 
teorizadas e variância de erro correlacionado. 


*N.de R.T.: A notação correta seria A,s4- 
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dores podem liberar esses caminhos como uma maneira 
de capturar algum aspecto específico de mensuração não 
representado por cargas fatoriais padrão. Para mais infor- 
mações sobre este tópico, o leitor deve consultar outras 
fontes [3]. 


Modelo de mensuração congênere 

A terminologia de SEM frequentemente estabelece que 
um modelo de mensuração é restrito pelas hipóteses do 
modelo. As restrições se referem especificamente ao 
conjunto de estimativas paramétricas fixadas. Um tipo 
de restrição comum é um modelo de mensuração supos- 
ta consistir em diversos construtos unidimensionais com 
todas as cargas cruzadas restritas a zero. Além disso, 
quando um modelo de mensuração também considera 
que não há covariância entre ou dentro de variâncias in- 
ternas de erro de construtos, significando que elas são 
todas fixadas em zero, o modelo de mensuração é dito 
congênere. Modelos de mensuração congêneres são con- 
siderados suficientemente restritos para representarem 
boas propriedades de medição [16]. Um modelo de men- 
suração congênere que atende essas exigências é consi- 
derado com validade de construto e é consistente com a 
boa prática de medição. 


Itens por construto 

Pesquisadores têm encarado uma espécie de dilema na 
decisão sobre quantos indicadores são necessários por 
construto. Por um lado, pesquisadores preferem muitos 
indicadores como uma tentativa de representar comple- 
tamente um construto e maximizar confiabilidade. Por 
outro lado, parcimônia encoraja pesquisadores a usar o 
menor número de indicadores para adequadamente re- 
presentar um construto. 

Mais itens (variáveis medidas ou indicadores) não são 
necessariamente melhores. Ainda que mais itens produ- 
zam estimativas de maior confiabilidade e generalidade 
[5], mais itens também demandam amostras maiores e 
podem tornar difícil a tarefa de produzir fatores verdadei- 
ramente unidimensionais. Por exemplo, mais indicadores 
aumentam a possibilidade de que fatores artificiais sejam 
produzidos. Quando pesquisadores aumentam o núme- 
ro de itens de escala (indicadores) representando um só 
construto (fator), eles podem incluir um subconjunto de 
itens que inadvertidamente se concentra em algum aspec- 
to específico de um problema e cria um sub-fator. Este 
problema se torna particularmente presente quando o 
conteúdo dos itens não foi cuidadosamente analisado com 
antecedência. 


Por exemplo, pesquisadores de marketing podem que- 
rer estudar atitudes de clientela perante uma loja em 
especial. Assim, itens como “Sou favorável em relação 
a esta loja” mostrariam elevada validade de conteúdo. 


Em um esforço de aumentar o número de itens, dois 
ou três que se concentrem em uma linha específica de 
produtos vendidos nesta loja podem ser utilizados. Tais 
itens podem empiricamente induzir um subfator distin- 
to mas relacionado. 


Na prática, você pode encontrar CFA conduzida com 
apenas um item representando alguns fatores. Contudo, a 
boa prática dita um mínimo de três itens por fator, sendo 
que quatro é preferível. 


Itens por construto e identificação. Uma breve intro- 
dução ao conceito de identificação estatística é dada aqui 
para esclarecer por que pelo menos três ou quatro itens 
são recomendados. Discutimos mais detalhadamente a 
questão da identificação em SEM posteriormente. O pro- 
blema da identificação é se existe informação suficiente 
para identificar uma solução para um conjunto de equa- 
ções estruturais. Informação é fornecida pela matriz de 
covariância da amostra. Um parâmetro pode ser estimado 
para cada variância e covariância únicas entre p itens me- 
didos, o que se calcula como 1/2[p(p+1)]. Desse modo, um 
grau de liberdade é perdido ou usado para cada parâme- 
tro estimado (k). Como discutido na próxima seção, isso 
indica o nível de identificação. 

Modelos podem ser caracterizados por seu grau de 
identificação, que é definido pelos graus de liberdade 
de um modelo depois que todos os parâmetros a serem 
estimados são especificados. Há três níveis de identifi- 
cação: 


Sub-identificado. Um modelo sub-identificado 
(também chamado de não-identificado) é aquele que tem 
mais parâmetros a serem estimados do que variâncias e 
covariâncias de itens (ou seja, há um número negativo de 
graus de liberdade). 


Por exemplo, um modelo de mensuração com apenas 
dois itens medidos e um único construto está sub-iden- 
tificado. A matriz de covariância é 2 x 2 e consiste de 
uma única covariância e duas variâncias de erro. As- 
sim, ela inclui três valores únicos. Um modelo de men- 
suração deste construto requer, no entanto, que duas 
cargas fatoriais e duas variâncias de erro sejam esti- 
madas (quatro parâmetros). Assim, uma solução única 
não pode ser determinada, uma vez que existem mais 
parâmetros a serem estimados do que valores únicos 
na matriz de covariância. 


Exatamente-identificado. Usando a mesma lógi- 
ca, um modelo de três itens é exatamente identificado, 
o que significa que ele inclui apenas o número suficiente 
de graus de liberdade para estimar todos os parâmetros 
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livres. Toda a informação é usada, o que significa que a 
CFA reproduzirá a matriz de covariância de amostra uni- 
vocamente. Por esta razão, modelos exatamente identifi- 
cados apresentam ajuste perfeito. Para ajudar a entender 
este conceito, você pode usar a equação para graus de 
liberdade dada no Capítulo 10 e então perceberá que o 
número de graus de liberdade resultante para um fator de 
três itens também seria nulo: 


[3(3 + 1)2]-6=0 


Em terminologia de SEM, um modelo com zero graus 
de liberdade é chamado de saturado. A estatística resul- 
tante de qualidade de ajuste de x” também é 0. Modelos 
exatamente identificados não testam uma teoria; o ajuste 
deles é determinado pelas circunstâncias. Como resulta- 
do, eles não são especialmente interessantes. 

A Figura 11-3 ilustra modelos sub e exatamente iden- 
tificados. Como observado na figura, o número de variân- 
cias/covariâncias únicas é excedido pelo número de parâ- 
metros estimados (modelo sub-identificado) ou é igual a 
ele (exatamente identificado). 


Super-identificado. Esses modelos têm mais ter- 
mos únicos de covariância e variância do que parâme- 
tros a serem estimados. Assim, para qualquer modelo 
de mensuração dado pode ser encontrada uma solução 
com um número positivo de graus de liberdade e um 
correspondente valor de qualidade de ajuste 2. Um 
modelo de mensuração unidimensional de quatro itens 
produz um modelo super-identificado para o qual um 
valor de ajuste pode ser computado [27]. O aumento do 
número de itens medidos apenas reforça este resulta- 
do. 


Sub-identificado 


| 0322 
d> 


0811 | 

5 

Quatro parâmetros para estimar 
(mostrados em cinza) 


s x X 
x, | var(1) cov(1,2) 
x, | cov(1,2) var(2) 


Três termos únicos 
(mostrados em negrito) 


FIGURA 11-3 


A Figura 11-4 ilustra uma situação de super-identifica- 
ção. Ela mostra resultados de CFA testando um fator de 
sentimento positivo unidimensional indicado por quatro 
itens de escala auto-declarados (Animado, Estimulado, 
Alegre e Radiante). Os itens medem quanto de cada 
uma das quatro emoções (x, — x,) foi experimentado por 
um cliente. A amostra inclui mais de 800 respondentes. 
Contando o número de itens na matriz de covariância, 
podemos perceber um total de 10 valores únicos da ma- 
triz de covariância. Podemos também contar o número 
de parâmetros de medição que são livres para serem esti- 
mados. Quatro estimativas de cargas (À,11, A 1 Ms Ma1) 
e quatro variâncias de erro (0,11, 0:22» 0533» 0544) formam 
um total de oito. Logo, o modelo resultante tem dois 
graus de liberdade (10 - 8). O modelo super-identificado 
produz xº = 14,9, com 2 graus de liberdade, o que foi de- 
terminado usando-se um programa de SEM. 

Considere o que aconteceria se somente os primeiros 
três itens fossem usados para indicar sentimento. A ma- 
triz de covariância consistiria de apenas seis itens para 
exatamente seis parâmetros a serem estimados (3 cargas 
e 3 variâncias de erro). O modelo seria exatamente iden- 
tificado. Finalmente, se somente dois itens - Animado 
e Estimulado — fossem usados, quatro estimativas para- 
métricas de itens (duas cargas e duas variâncias de erro) 
seriam necessárias, mas a matriz de covariância conteria 
apenas três itens. Portanto, o construto seria sub-iden- 
tificado. 


Deve ser observado que mesmo que um construto uni- 
dimensional de dois itens de CFA seja sub-identificado 
por si só, um modelo de CFA super-identificado pode 


Exatamente identificado 
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Seis parâmetros para estimar 
(mostrados em cinza) 


s X, X Xs 

x, | var(1) cov(1,2) cov(1,3) 
x |cov(1,2) var(2) cov(2,3) 
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Seis termos únicos 
(mostrados em negrito) 


Modelos de CFA sub-identificado e exatamente identificado. 
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Matriz de covariância simétrica 


Xi 
X2 
xa 
X4 


EY [oz |ossa [084 


X, X, X; X, 
2,01 

1,43 2,01 

1,31 1,56 2,24 

1,36 1,54 1,57 2,00 


10 termos de variância/covariância única 


Ajuste do modelo 


ô, 7 33 3, xº= 14,9 
df=2 
p= 0,001 
Oito caminhos para estimar CFI= 0,99 


Itens medidos 


Estimativas de carga Estimativas de variância de erro 


X, = Animado Axm1= 0,78 0811= 0,39 
X,= Estimulado  àx,1= 0,89 0822= 0,21 
X,= Alegre Ava = 0,83 0833= 0,31 
X,= Radiante Asas = 0,87 0344 = 0,24 


FIGURA 11-4 Modelo de um fator e quatro itens é super-identificado. 


resultar quando este construto é integrado ao modelo de 
mensuração geral. As mesmas regras de identificação ain- 
da se aplicam como anteriormente descrito. Mas os graus 
de liberdade extras de alguns dos outros construtos po- 
dem fornecer os graus de liberdade necessários para iden- 
tificar o modelo geral. Isso não significa que os problemas 
inerentes com medidas de um ou dois itens desapareçam 
completamente quando os integramos a um modelo maior. 
Estritamente falando, unidimensionalidade de construtos 
com menos de quatro indicadores de itens não pode ser 
determinada separadamente [1]. A dimensionalidade de 
qualquer construto com apenas um ou dois itens só pode 
ser estabelecida relativamente a outros construtos. Cons- 
trutos com um ou dois itens também aumentam a possibi- 
lidade de problemas com confusão de interpretação [14]. 
Sob o enfoque da experiência dos autores, medidas de um 
e dois itens são associadas com uma maior possibilida- 
de de problemas de estimação encontrados em estágios 
posteriores do processo SEM, incluindo problemas com 
convergência (a identificação de uma solução matemática 
apropriada). 

Resumidamente, quando se especifica o número de in- 
dicadores por construto, o que se segue é recomendado: 


e Use quatro indicadores sempre que possível. 

e Ter três indicadores por construto é aceitável, particular- 
mente quando outros construtos têm mais do que três. 

e Construtos com menos do que três indicadores deveriam ser 
evitados. 


Modelos fatoriais reflexivos versus formativos 

A questão de causalidade afeta a teoria de mensuração. 
Pesquisadores da ciência do comportamento geralmente 
estudam fatores latentes que são considerados causado- 
res das variáveis medidas. Às vezes, porém, a causalidade 
pode ser revertida. A direção contrastante de causalidade 
conduz a abordagens contrastantes de mensuração — mo- 
delos de mensuração reflexivos versus formativos. 


Fatores indicadores reflexivos. Até agora nossa discus- 
são sobre CFA assumiu uma teoria de mensuração refle- 
xiva. Uma teoria reflexiva de mensuração é baseada na 
idéia de que construtos latentes são a causa das variáveis 
medidas e que o erro resulta de uma incapacidade de 
explicar por completo essas medidas. Logo, as setas são 
esboçadas de construtos latentes para variáveis medidas. 
Assim, medidas reflexivas são consistentes com a teoria 
clássica de teste [42]. 


Em nosso exemplo anterior, acredita-se que o construto 
Compromisso de Cliente cause indicadores medidos es- 
pecíficos, como a disposição de obter a marca X, de dizer 
aos amigos para comprarem a marca X, e de continuar a 
comprar a marca X, mesmo que ela custe mais. 


Em contrapartida, uma teoria formativa de mensura- 
ção é modelada com base na suposição de que as variáveis 
medidas são a causa do construto. O erro em modelos for- 
mativos de mensuração é uma incapacidade de explicar 
por completo o construto. Uma suposição importante é 
que construtos formativos não são considerados latentes. 
Ao invés disso, eles são vistos como índices nos quais cada 
indicador é uma causa do construto. 


Um exemplo típico seria um índice de classe social [21]. 
Classe social frequentemente é vista como uma compo- 
sição do nível educacional de alguém com prestígio ocu- 
pacional e renda (ou, às vezes, patrimônio). Classe social 
não causa esses indicadores, como no caso reflexivo. No 
lugar disso, qualquer indicador formativo é considerado 
como uma causa do índice. 


Diversas diferenças importantes separam os cons- 
trutos reflexivos dos formativos. Muitas dessas diferen- 
ças são particularmente importantes em um referencial 
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SEM. Por exemplo, quando se empregam indicadores 
múltiplos tradicionais para representar construtos, ge- 
ralmente não podemos diferenciar entre construtos for- 
mativos e reflexivos, pois ambos os fatores são tratados 
da mesma maneira. No entanto, a SEM nos permite di- 
ferenciar modelos indicadores formativos de reflexivos 
mudando a direção da relação entre variáveis medidas e 
construtos, o que muda as equações que representam o 
modelo. 

Todos os elementos de validade de construto são im- 
portantes com indicadores reflexivos. Portanto, para qual- 
quer construto reflexivo, a suposição é que todos os itens 
indicadores são causados pelo mesmo construto latente 
e são altamente correlacionados entre si. Teoricamente, 
então, os termos individuais são permutáveis e qualquer 
item pode ser deixado de lado sem mudar o construto, 
desde que duas condições sejam atendidas: (1) o constru- 
to deve ter confiabilidade suficiente; e (2) pelo menos três 
itens devem ser especificados para evitar problemas com 
identificação [21]. Indicadores reflexivos podem ser vistos 
como uma amostra de todos os itens possíveis disponíveis 
dentro do domínio conceitual do construto [20]. Como 
consequência, indicadores reflexivos de um dado constru- 
to devem se mover juntos, o que significa que mudanças 
em um são associadas com mudanças proporcionais nos 
demais indicadores. 

Modelos indicadores reflexivos são mais comuns nas 
ciências sociais. Construtos típicos de ciências sociais, 
como atitudes, personalidade e intenções comportamen- 
tais, se ajustam bem ao modelo de mensuração reflexivo 
[12]. Analogamente, um estudo de sintomas médicos ti- 
picamente seria reflexivo. Por exemplo, sintomas como 
pouco fôlego, baixa resistência física, dificuldade respi- 
ratória e funcionamento reduzido dos pulmões seriam 
considerados indicadores que refletiriam o fator latente 
de enfisema. Os sintomas não são a causa da doença. Ao 
invés disso, a doença provoca os sintomas. 


Fatores indicadores formativos. Em um modelo de 
mensuração formativo, os indicadores são a causa do fa- 
tor (construto) [11]. Por exemplo, em negócios, investi- 
dores frequentemente demonstram interesse em um fator 
(índice) de falência. Em outras palavras, quão perto uma 
pessoa ou empresa está da falência? Diversas medidas 
financeiras podem ser consideradas, incluindo o total de 
vendas, patrimônio, dívidas, gastos, ganhos líquidos e ju- 
ros, entre outras. Esses fatores podem ser considerados 
como a causa da falência e, assim, eles seriam apropria- 
dos como indicadores formativos. Usando o exemplo so- 
bre saúde já mencionado, um fator formativo enfisema 
poderia especificar indicadores como fumo, exposição 
a toxinas, bronquite crônica e outros. Esses indicadores 
formariam, ao invés de refletirem, a probabilidade de um 
indivíduo ter enfisema. 


A Figura 11-5 ilustra um modelo indicador formativo. 
Cada indicador (x) é um item de índice que causa o cons- 
truto composto (m,). Cada q representa uma correlação 
entre esses itens de índice, e e, é um parâmetro indican- 
do a variância de erro no índice. Observe que o erro está 
agora no fator e não nos itens medidos. Analogamente, 
como a causalidade é dos itens para o fator (construto), 
e não o contrário, o fator não explica as correlações en- 
tre itens. Essas diferenças levam a algumas mudanças no 
teste e uso de escala. 


Modelos de mensuração formativos demandam um 
processo diferente de validação. Como indicadores for- 
mativos não têm que ser altamente correlacionados, con- 
sistência interna não é um critério útil de validação para 
eles. De fato, itens formativos podem até mesmo ser mu- 
tuamente excludentes [28]. Como o erro está no fator, 
os critérios de validação mais importantes se referem à 
validade preditiva. Assim, os itens formativos individuais 
reunidos deveriam explicar a maior parte da variância no 
fator composto (construto), e o fator deveria se relacio- 
nar com as outras medidas de uma maneira teoricamente 
consistente. Além disso, cada um dos itens formativos in- 
dividuais pode estar correlacionado com alguma variável 
externa com a qual o fator deveria estar fortemente rela- 
cionado. No caso de classe social, todos os itens de índice 
deveriam se relacionar com o valor da casa de alguém, por 
exemplo. Orientações para validar fatores formativos não 
são tão facilmente determinadas quanto para modelos re- 
flexivos [21]. No entanto, itens deveriam se correlacionar 
com um padrão externo de uma forma razoavelmente ele- 
vada — um mínimo de 0,5 ou mais. 

Note que um modelo de mensuração formativo é não- 
identificado. Logo, um só modelo de mensuração forma- 
tivo não pode ser testado quanto a ajuste usando-se SEM 
sem algum tipo de alteração. As alterações requerem 
que variáveis medidas adicionais sejam incluídas. Uma 
abordagem comum seria a inclusão de pelo menos duas 
variáveis extras que sejam resultados do fator formati- 
vo. Por exemplo, um construto latente reflexivo pode ser 
adicionado ao modelo. Deveria ser um construto que seja 
teoricamente relacionado com o fator formativo. Desse 
modo, o fator reflexivo não apenas identifica o modelo, 


ú, 
e 


FIGURA 11-5 Ilustração de um modelo indicador formativo. 
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mas pode ajudar a estabelecer validade nomológica. Por 
conta dessas questões, modelos indicadores formativos 
apresentam maiores dificuldades com identificação esta- 
tística [33]. 


A Figura 11-6 ilustra uma abordagem para identificar 
um modelo com um fator formativo. O construto m, re- 
presenta um fator formativo, exatamente como na Fi- 
gura 11-5. O construto m, é um fator reflexivo, como se 
mostra na Figura 11-4, apesar de as notações serem ligei- 
ramente diferentes por motivos que ficam claros no pró- 
ximo capítulo. O mais notável é que y é usada no lugar 
de x para indicar os itens indicadores medidos, e e agora 
é empregado para representar variância de erro no item 
medido. O fator formativo poderia representar o grau de 
alguma doença que um indivíduo contraiu, com base nas 
causas (x, — x,), € O fator reflexivo poderia corresponder 
à evidenciada da doença como evidenciada ou refletida 
pelos sintomas (y, — y,). B,, representa uma relação cau- 
sal entre os dois construtos. 


As implicações de se dispensar itens indicadores são 
diferentes em modelos reflexivos e formativos. Itens refle- 
xivos são considerados representativos do mesmo domí- 
nio conceitual; logo, descartar itens não muda o significa- 
do do construto latente. Itens com baixas cargas fatoriais 
podem ser dispensados de modelos reflexivos sem sérias 
consequências, desde que um construto retenha um nú- 
mero suficiente de indicadores. A validade de uma escala 
formativa repousa mais sobre a suposição de que todas 
as variáveis formam o índice composto. Conceitualmente, 
um fator formativo deveria ser representado pela popu- 
lação inteira de indicadores que o formam [28]. Portanto, 
itens indicadores não deveriam ser dispensados por causa 
das baixas correlações entre itens e total. 

Além disso, elevada colinearidade entre indicadores, o 
que não é uma questão com indicadores reflexivos, pode 
apresentar problemas significantes em um modelo forma- 
tivo, pois os parâmetros que conectam indicadores forma- 
tivos com o construto podem se tornar não-confiáveis (ver 
discussão sobre multicolinearidade no Capítulo 4). Se tais 
parâmetros não são confiáveis, então fica impossível va- 
lidar o item. Assim, o pesquisador pode se deparar com 


um dilema. Por um lado, descartar um item pode tornar 
o índice incompleto, mas mantê-lo pode tornar uma esti- 
mativa não-confiável. Essas questões que são associadas 
com modelos indicadores formativos ainda estão por ser 
resolvidas de maneira completa [21]. 


Diferença entre modelos reflexivos e formativos 
Diferenças significativas podem separar modelos de men- 
suração reflexivos dos formativos, mas distingui-los nem 
sempre é fácil. Modelos reflexivos são geralmente mais 
fáceis de se trabalhar, têm sido tradicionalmente mais 
usados em ciências sociais, e parecem representar melhor 
muitas características de diferenças individuais e medidas 
perceptuais. No entanto, modelar incorretamente um fa- 
tor pode provocar má interpretação e conduzir a conclu- 
sões questionáveis. A decisão final sobre o tipo de modelo 
de mensuração deve ser sustentada na verdadeira natu- 
reza do construto sob estudo. A lista de questões a seguir 
pode ser útil para resolver tal problema [28]. 


1. Qual é a direção de causalidade entre os indicadores múlti- 
plos e o fator (construto)? 


e Itens reflexivos são causados pelo fator. 
e Itens formativos causam o fator. 


2. Qual é a natureza da covariância entre os itens indicadores? 


e Se é esperado que os itens tenham covariância entre si, 
então o modelo reflexivo é mais adequado. Se um indica- 
dor não deve ser muito relacionado com os demais, você 
provavelmente deve eliminá-lo. Assim, um ponto-chave 
é que, com modelos reflexivos, todos os indicadores ten- 
dem a se mover juntos, o que significa que mudanças em 
um serão associadas com mudanças nos outros. Eleva- 
da covariância entre itens fornece evidência consistente 
com indicadores reflexivos. 

e Indicadores formativos de um fator não devem exibir co- 
variância elevada. Assim, um índice pode ser composto 
de diversas medidas que não compartilham uma base co- 
mum. Como resultado, itens indicadores formativos não 
devem se mover juntos. 


3. Há elevada duplicidade no conteúdo dos itens? 


e Se todos os itens indicadores compartilham uma base 
conceitual em comum, o que significa que todos indicam 
a mesma coisa, então é melhor considerar o modelo de 
mensuração como reflexivo. Quando todos os itens re- 


FIGURA 11-6 Fator formativo com um fator latente adicionado que identifica o modelo. 
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presentam o mesmo conceito, eliminar um deles não 
muda substancialmente o significado de um construto. 

e Itens formativos não precisam compartilhar uma base 
conceitual. Logo, parece que os indicadores causam o 
construto formativo, mas eles nada têm em comum do 
ponto de vista conceitual, então eles ainda são aceitáveis 
como indicadores formativos. 

e (Com modelos indicadores formativos, descartar um item 
produz uma mudança importante no construto. 


4. Como os indicadores se relacionam com outras variáveis? 


e Todos os indicadores de um só construto se relacionam 
com outras variáveis de uma maneira semelhante com 
um modelo de mensuração reflexivo. 

* Os indicadores de um construto formativo não precisam 
se relacionar com outras variáveis de uma maneira seme- 
lhante. Para modelos de mensuração formativos, o pes- 
quisador espera que um indicador produza um padrão 
diferente de relações com uma variável externa do que 
aconteceria com outro indicador. 


Responder essas questões pode ajudar a resolver o 
problema de distinguir indicadores reflexivos e formati- 


REGRAS PRÁTICAS 11-3 


Desenvolvimento do modelo 
de mensuração geral 


Em aplicações padrão de CFA que testam uma teoria 
de mensuração, termos de covariância de erro (interna 
e entre itens) devem ser fixados em zero e não devem 
ser estimados 
Em aplicações padrão de CFA que testam uma teoria 
de mensuração, todas as variáveis medidas devem ser 
livres para carregarem apenas sobre um construto 
Construtos latentes devem ser indicados por, pelo 
menos, três variáveis medidas, sendo preferível que 
sejam quatro ou mais; em outras palavras, fatores 
latentes devem ser estatisticamente identificados 
Fatores formativos não são latentes e não são validados 
como os fatores reflexivos convencionais (consistência 
interna e confiabilidade não são importantes) 
As variáveis que constituem um fator formativo devem 
explicar a maior porção de variação no construto 
formativo em si e devem se relacionar fortemente com 
outros construtos que são conceitualmente relacionados 
entre si (correlação mínima de 0,5) 
e Fatores formativos apresentam maiores dificuldades 
com identificação estatística 
Variáveis ou construtos adicionais devem ser 
incluídos juntamente com um construto formativo, a 
fim de se alcançar um modelo super-identificado 
Um fator formativo deve ser representado por toda 
a população de itens que o formam; logo, itens não 
devem ser descartados por conta de uma carga baixa 
Com modelos reflexivos, qualquer item que não 
se espera estar altamente correlacionado com os 
demais indicadores de um fator deve ser eliminado 


vos. No entanto, deve ser tomado cuidado, pois a primeira 
questão é a mais importante. Se você sabe a direção cau- 
sal dos caminhos de mensuração, mas as outras condições 
são inconsistentes com o modelo correspondente, você 
pode precisar reavaliar a natureza conceitual do construto 
ou os passos necessários para formar uma medida válida 
de seu construto. 


Estágio 3: Planejamento de um estudo 
para produzir resultados empíricos 


O terceiro estágio envolve o delineamento de um estu- 
do que produzirá resultados confirmatórios. Em outras 
palavras, a teoria de mensuração do pesquisador será 
testada. Aqui, todas as regras e procedimentos padrões 
que produzem pesquisa descritiva válida se aplicam [25]. 
Se tudo vai bem com o modelo de mensuração (CFA), 
a mesma amostra será usada para testar o modelo es- 
trutural (SEM). Devemos observar que os procedimen- 
tos iniciais de análise de dados descritos no Capítulo 2 
devem ser primeiramente executados para identificar 
quaisquer problemas com os dados, incluindo questões 
como erros na entrada de informações. Após conduzir 
essas análises preliminares, o pesquisador deve tomar 
algumas decisões cruciais sobre o planejamento do mo- 
delo de CFA. 


Escalas de mensuração em CFA 

Modelos de CFA geralmente contêm indicadores reflexi- 
vos medidos com uma escala ordinal ou melhor. Escalas 
que contêm mais de quatro categorias de resposta podem 
ser tratadas como intervalares, ou pelo menos como se as 
variáveis fossem contínuas. Todos os itens indicando um 
fator não precisam ser do mesmo tipo de escala, e valores 
de diferentes escalas também não precisam ser padroni- 
zados (matematicamente transformados para uma am- 
plitude comum de escala) antes da SEM ser usada. Não 
obstante, às vezes a combinação de escalas com diferen- 
tes amplitudes pode exigir um tempo de processamento 
significativamente maior. Padronização pode tornar mais 
fácil a interpretação de coeficientes e de valores de res- 
posta, de modo que isso é feito em certas ocasiões, antes 
de se estimar o modelo. Logo, um levantamento típico 
pode fornecer dados adequados para testar um modelo 
CFA usando SEM. 


Por exemplo, a medida Gastos de Clientes, introduzi- 
da no começo deste capítulo, consiste de quatro itens, 
sendo que cada um tem um número diferente de poten- 
ciais valores de escala (10 pontos, 100 pontos etc.). Se o 
pesquisador quiser, todos eles podem ser transformados 
para uma escala em comum (p.ex., de 100 pontos) antes 
de se estimar o modelo, para facilitar a interpretação; 
mas este é um procedimento desnecessário. 
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SEM e amostragem 

Questões relativas a tamanho amostral e SEM em geral 
foram tratadas no Capítulo 10. Mas, muitas vezes, CFA 
requer o emprego de múltiplas amostras. Testar teoria de 
mensuração geralmente demanda múltiplos estudos e/ou 
amostras. Uma amostra inicial pode ser examinada com 
EFA, e os resultados podem ser usados para purificação 
posterior. Mesmo depois que os resultados de CFA foram 
obtidos, porém, resultados ao longo de múltiplas amostras 
e contextos podem fornecer evidência de estabilidade e 
generalidade do modelo. 


Especificação do modelo 

CFA é usada para testar o modelo de mensuração. Como 
anteriormente observado, uma distinção crítica entre 
CFA e EFA é a habilidade de o pesquisador executar um 
teste exato da teoria de mensuração pela especificação da 
correspondência entre indicadores e construtos. A especi- 
ficação usando CFA é diferente de EFA. EFA não testa 
uma teoria e, portanto, este passo não é exigido para va- 
lidar uma teoria de mensuração. Como será ilustrado nas 
discussões a seguir, o pesquisador especifica (libera para 
estimação) os indicadores associados com cada construto, 
bem como as correlações entre construtos. 

Uma característica ímpar na especificação dos indica- 
dores para cada construto é o processo de “estabelecer 
uma escala” de um fator latente. Por ser não-observado, 
um fator latente não tem qualquer escala métrica, o que 
significa que não tem intervalo de valores. Assim, uma es- 
cala deve ser fornecida conforme uma das duas maneiras 
dadas a seguir: 


1. Uma escala pode ser estabelecida fixando-se uma das cargas 
fatoriais e atribuindo-lhe um valor (1 é um bom valor). 

2. A variância do construto pode ser fixada com um valor. 
Novamente, 1 é uma boa opção. Usar o valor 1, por exem- 
plo, resulta em uma matriz de correlação das relações entre 
construtos. 


Com CFA, se você usar o programa AMOS, ele fixará 
automaticamente uma das estimativas de cargas fatoriais 
como sendo 1. Se você usar LISREL, pode especificar 
esta carga fatorial com comandos do programa. Em certos 
momentos, um pesquisador pode querer impor restrições 
adicionais sobre um modelo CFA. Por exemplo, às vezes 
é útil colocar dois ou mais parâmetros como sendo iguais, 
ou considerar um parâmetro específico com um valor es- 
pecífico. Informações sobre a imposição de restrições adi- 
cionais podem ser encontradas na documentação para o 
programa SEM de escolha. 


Questões sobre identificação 

Uma vez que o modelo de mensuração seja especificado, 
o pesquisador deve rever as questões relativas à falta de 
um modelo identificado, ou seja, deve reconhecer proble- 
mas de identificação e potenciais ações corretivas. Ante- 
riormente sugerimos que super-identificação é o estado 


desejado para CFA e modelos SEM em geral. Ainda que 
a comparação dos graus de liberdade com o número de 
parâmetros a serem estimados pareça simples, na prática, 
estabelecer a identificação de um modelo pode ser compli- 
cado e frustrante. Esta complexidade se deve, em parte, ao 
fato de que uma vasta gama de problemas e idiossincrasias 
de dados podem se manifestar em mensagens de erros, su- 
gerindo uma falta de convergência ou de identificação. 
Durante o processo de estimação, o motivo mais pro- 
vável da pane no programa ou da produção de resultados 
sem sentido é um problema com identificação estatística. 
No entanto, à medida que modelos SEM se tornam mais 
complexos, garantir que um modelo seja identificado pode 
ser problemático [13]. Uma vez que o problema seja diag- 
nosticado, ações corretivas devem ainda ser aplicadas. 


Prevenção contra problemas de identificação. Diversas 
orientações podem ajudar a determinar o status de iden- 
tificação de um modelo SEM [44] e ajudar o pesquisador 
a evitar problemas com identificação. As condições de or- 
dem e classificação para identificação são as duas regras 
mais básicas [11], mas elas podem ser suplementadas por 
regras básicas na especificação do construto. 


e As condições de ordem e classificação representam condi- 
ções necessárias e suficientes para identificação. A condição 
de ordem se refere à exigência discutida anteriormente de 
que os graus de liberdade resultantes para um modelo sejam 
maiores que zero. Ou seja, o número de termos únicos de 
covariância e variância menos o número de estimativas de 
parâmetros livres deve ser positivo. Esta condição pode ser 
verificada calculando-se os graus de liberdade para o mode- 
lo proposto. 

Em contrapartida, a condição de classificação pode ser 
difícil de verificar, e uma discussão detalhada demanda- 
ria um conhecimento razoável de álgebra linear.* O leitor 
pode consultar qualquer livro de álgebra linear para uma 
descrição matemática detalhada. Apesar de ser difícil de 
apresentar em termos simples, a condição de classificação 
requer que cada parâmetro estimado seja unívoca e alge- 
bricamente definido. Se você pensar em um conjunto de 
equações que possa definir qualquer variável dependente, 
a condição de classificação é violada se duas equações são 
duplicatas matemáticas. A condição de classificação pode 
ser muito mais difícil de estabelecer do que a condição de 
ordem. Uma mensagem de um programa SEM referente à 
dependência linear pode ser associada com uma violação da 
condição de classificação. 

e As condições de classificação e de ordem podem ser neces- 
sárias e suficientes para identificação, mas, dada a dificulda- 
de de estabelecer a condição de classificação, pesquisadores 
se voltam para diretrizes mais gerais. Tais diretrizes incluem 
a regra de três indicadores. Ela é satisfeita quando todos os 
fatores em um modelo congênere têm pelo menos três indi- 
cadores significantes. Uma regra de dois indicadores tam- 


*N. de T.: O autor está se referindo, na verdade, a sistemas de equa- 
ções lineares, assunto que normalmente é estudado em álgebra li- 
near. No entanto, o leitor não precisa se aprofundar significativa- 
mente em álgebra linear para compreender este assunto. 
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bém estabelece que um modelo fatorial congênere com dois 
itens significantes por fator será identificado desde que cada 
fator tenha também uma relação significante com algum ou- 
tro. Fatores de um item causam a maioria dos problemas 
com identificação. 


Reconhecimento de problemas de identificação. Ape- 
sar de questões de identificação serem a fonte de muitos 
problemas de estimação encontrados em SEM, há poucos 
indicadores da existência e origem de tais questões. Des- 
se modo, o pesquisador deve considerar uma vasta gama 
de sintomas que devem ajudar a reconhecer o problema 
de identificação. Deve ser observado que ocasionalmen- 
te avisos ou mensagens de erro sugerem que apenas um 
parâmetro não é identificado, o que é possivelmente as- 
sociado com violação da condição de classificação. A des- 
peito de o pesquisador poder tentar resolver o problema 
eliminando a variável transgressora, muitas vezes isso não 
contorna a causa inerente e o problema acaba persistindo. 
Infelizmente, os programas SEM fornecem medidas diag- 
nósticas mínimas para problemas de identificação. Assim, 
o pesquisador deve geralmente confiar em outras manei- 
ras para reconhecer problemas de identificação a partir 
dos sintomas descritos na lista a seguir. 


e Erros padrão muito grandes para um ou mais coeficientes. 

e Incapacidade de o programa inverter a matriz de informa- 
ção (nenhuma solução pode ser encontrada). 

e Estimativas evidentemente sem sentido ou impossíveis, 
como variâncias negativas de erro ou estimativas paramétri- 
cas muito grandes, incluindo cargas fatoriais e correlações 
entre os construtos de |1,0l* (valor absoluto de 1,0). 

e Modelos que resultam em diferentes estimativas de parà- 
metros com base no uso de diferentes valores iniciais. Em 
programas SEM, o pesquisador pode especificar um valor 
inicial para qualquer parâmetro estimado como um ponto 
inicial para o processo de estimação. No entanto, estimativas 
de modelo devem ser comparáveis, dado qualquer conjunto 
de valores iniciais razoáveis. Quando ocorrem questões so- 
bre identificação de qualquer parâmetro, um segundo teste 
pode ser executado. Você primeiramente estima um mode- 
lo CFA e obtém a estimativa paramétrica. Em seguida, fixa 
o coeficiente em seu valor estimado e processa novamente 
o modelo. Se o ajuste geral do modelo variar consideravel- 
mente, problemas de identificação são apontados. 


Como podemos ver, problemas de identificação po- 
dem ser manifestados em resultados SEM de muitas 
maneiras diferentes. O pesquisador jamais deve confiar 
apenas no programa computacional para reconhecer pro- 
blemas de identificação, mas deve também diligentemen- 
te examinar os resultados para garantir que não existe 
qualquer problema. 


Origens e ações corretivas para problemas de identificação. 
Como vimos, problemas de identificação podem ter mui- 
tos efeitos distintos sobre resultados SEM. Mas quais são 


* N. de R. T.: Na realidade, a expressão correta seria |+ 1,0], significan- 
do que correlações muito altas, em módulo, seriam um dos sintomas. 


as causas inerentes? Às vezes, os problemas são realmente 
causados por um erro na especificação feita pelo pesqui- 
sador. Mas problemas de identificação surgem de muitas 
outras fontes também. Na discussão que se segue, não 
apenas discutimos os tipos comuns de fontes para proble- 
mas de identificação, mas também oferecemos sugestões 
para lidar com os problemas, sempre que possível. Alguns 
dos comentários se referem a questões sobre a maneira 
de escrever comandos de programa, como normalmente 
se faz em LISREL ou EQS. Algumas das questões mais 
comuns que levam a problemas com identificação incluem 
as seguintes: 


1. O pesquisador indicou para o modelo um número diferente 
de variáveis em relação ao número selecionado para com- 
por a matriz de covariância. Por exemplo, o pesquisador 
pode escolher as variáveis y, até y, para análise, mas er- 
roneamente especificar o número de variáveis y como 11. 
Quando a saída fornece uma mensagem indicando que a 
matriz de covariância não é identificada, então este é um 
ponto importante para se verificar. 

2. Eventualmente, por engano, pesquisadores incluem a mes- 
ma variável duas vezes, o que pode facilmente acontecer 
com qualquer programa SEM. Por exemplo, um comando 
Select (Escolha) é usado em alguns programas SEM para 
indicar quais variáveis de um banco de dados maior serão 
incluídas em uma análise específica. Um comando Select 
de LISREL pode receber equivocadamente a seguinte en- 
trada: 


SE 
YIY2Y3Y4YSYS5 Y7YS YO YIO VII YIZ/ 


Com y, entrando duas vezes, a matriz de covariância 
resultante será não-positiva definida e nenhuma solução 
única pode ser encontrada. Se tal mensagem for recebida, é 
importante procurar por esta forma de erro. Este problema 
não é exclusivo de LISREL. Uma variação dele com a inter- 
face gráfica de AMOS acontece quando uma variável (ou 
uma duplicata) é erroneamente designada a um construto 
mais de uma vez. 

3. A matriz de covariância é pequena comparada com o nú- 
mero de parâmetros estimados. Este problema é prova- 
velmente acompanhado de uma violação da regra de três 
indicadores. Amostras pequenas (menos de 200) aumen- 
tam a possibilidade de problemas nesta situação. A solu- 
ção mais simples é evitar esta situação, incluindo medidas 
o suficiente para evitar a violação dessas regras. Caso não 
seja possível, o pesquisador pode tentar acrescentar algu- 
mas restrições que liberarão graus de liberdade [26]. Uma 
restrição potencial que pode ajudar a obter uma solução 
CFA é impor suposições de equivalência-tau, as quais 
demandam que as cargas fatoriais para cada fator sejam 
iguais. Equivalência-tau pode ser feita para um ou mais 
fatores. Uma segunda possibilidade é fixar as variâncias 
de erro em um valor conhecido ou especificado. Tercei- 
ro, as correlações entre construtos podem ser fixadas se 
algum valor teórico pode ser designado. Em alguns casos, 
porém, dois construtos podem ser sabidos como indepen- 
dentes. 
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A emergência de um problema de identificação deve 
ser resolvida antes que os resultados possam ser aceitos. 
Apesar de uma cuidadosa especificação do modelo usan- 
do as orientações discutidas anteriormente poder ajudar o 
pesquisador a evitar muitos desses problemas, ele sempre 
deve estar alerta para analisar os resultados com o obje- 
tivo de reconhecer problemas de identificação onde quer 
que eles ocorram. 


Problemas com estimação 

Outro tipo de problema encontrado em modelos SEM 
envolve a estimação de parâmetros que são logicamente 
impossíveis. Com isto queremos dizer que os valores es- 
timados carecem de sentido. Ao invés de não fornecerem 
resultados, a maioria dos programas SEM completará o 
processo de estimação apesar desses problemas. Passa 
então a ser responsabilidade do pesquisador a identifica- 
ção dos resultados ilógicos e a correção do modelo para 
obter resultados aceitáveis. Discutimos os dois tipos mais 
comuns de problemas de estimação, bem como potenciais 
causas e soluções. 


Casos Heywood. Uma solução fatorial que produz uma 
estimativa de variância de erro inferior a zero (negativa) 
é chamada de caso Heywood. Tal resultado é logicamen- 
te impossível porque implica um erro menor que 0% em 
um item e, por inferência, significa que mais de 100% da 
variância em um item é explicada. Casos Heywood são 
particularmente problemáticos em modelos CFA com pe- 
quenas amostras ou quando a regra de três indicadores 
não é seguida [41]. Modelos com amostras com mais de 
300 que atendem à regra de três indicadores dificilmente 
produzem casos Heywood. Programas SEM podem gerar 
uma solução imprópria quando um caso Heywood está 
presente. Uma solução imprópria é aquela para a qual o 
programa SEM não converge completamente, geralmen- 
te acompanhada por um aviso ou mensagem de erro que 
indica que uma estimativa de variância de erro não é iden- 
tificada, advertindo que a solução pode não ser confiável. 

Diversas opções são possíveis quando surgem casos 
Heywood. Uma solução é fixar a estimativa transgressora 
em um valor muito pequeno, como 0,005 [22]. Apesar de 
este valor poder identificar o parâmetro, ele pode levar a 
um ajuste menor, pois o valor dificilmente será o verda- 
deiro valor da amostra. Outra solução é eliminar a variá- 
vel transgressora. Esta alternativa pode não ser atraente, 
caso a eliminação de um item reduza o número de itens 
por construto para algo menor que três. Outras restrições 
também podem ser adicionadas aos indicadores fatoriais. 
Por exemplo, poderia ser acrescentada a suposição de que 
todas as cargas fatoriais são iguais. Esta opção pode ser 
teoricamente mais interessante do que fixar as cargas ou 
variâncias de erro em um valor específico. Também pode 
diminuir o ajuste na medida em que a igualdade não vale. 
No entanto, esta é uma abordagem que tem demonstrado 
ser útil para os autores. 


Parâmetros padronizados ilógicos. Outro problema 
de estimação com resultados de SEM é que eles podem 
produzir estimativas de correlação entre construtos que 
excedam |1,0l ou mesmo coeficientes padronizados de 
caminhos que sejam maiores que |1,0l. Novamente, es- 
sas estimativas são teoricamente impossíveis e provavel- 
mente indicam algum outro problema nos dados. Muitas 
vezes, problemas de identificação são a causa, apesar de 
outras questões sobre dados (como indicadores alta- 
mente correlacionados ou violações das suposições es- 
tatísticas inerentes) também serem causas em potencial. 
Muitas vezes, um dos métodos já discutidos corrigirá 
problemas de identificação que se relacionam com esta 
situação. 


Resumo 

Como ocorre com outras técnicas multivariadas discuti- 
das neste texto, conseguir uma solução é apenas o pas- 
so inicial para uma solução final. Modelos CFA devem 
ser examinados quanto a quaisquer sintomas que sejam 
indicadores de problemas inerentes de identificação ou 
de qualidade dos dados. Somente quando o pesquisador 
está convencido que o processo de estimação evitou tais 
complicações é que o processo pode prosseguir para o 
próximo estágio. 


Estágio 4: Avaliação da validade 

do modelo de medida 

Uma vez que o modelo de mensuração seja corretamen- 
te especificado, um modelo SEM é estimado para forne- 
cer uma medida empírica das relações entre variáveis e 
construtos representados pela teoria de mensuração. Os 
resultados nos permitem comparar a teoria com a reali- 


REGRAS PRÁTICAS 11-4 


Planejamento de um estudo para fornecer 
resultados empíricos 


A escala de um construto latente pode ser determinada 

da seguinte maneira: 

e Fixando uma carga e atribuindo seu valor como 1, ou 

e Fixando a variância do construto e atribuindo seu 
valor como 1 

Modelos de mensuração reflexivos congêneres 


nos quais todos os construtos têm pelo menos três 
indicadores de item devem ser estatisticamente 


identificados 

O pesquisador deve verificar erros na especificação 
do modelo de mensuração quando problemas de 
identificação são indicados 

Modelos com amostras grandes (mais de 300) que 
atendem à regra de três indicadores geralmente não 
produzem casos Heywood 
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dade representada pelos dados da amostra. Em outras 
palavras, percebemos o quão bem a teoria se ajusta aos 
dados. 


Avaliação de ajuste 

Ajuste foi discutido detalhadamente no Capítulo 10. 
Lembre-se que os dados da amostra são representados 
por uma matriz de covariância de itens medidos, en- 
quanto a teoria corresponde ao modelo de mensuração 
proposto. Equações são implicadas por este modelo, 
como discutido no início deste capítulo e no Capítulo 
10. Essas equações nos permitem estimar a realidade 
computando uma matriz de covariância estimada com 
base em nossa teoria. O ajuste compara as duas matrizes 
de covariância. 

Orientações para qualidade de ajuste dadas no Capítu- 
lo 10 se aplicam. Aqui o pesquisador tenta examinar todos 
os aspectos de validade de construto por meio de várias 
medidas empíricas. O resultado é que a CFA viabiliza um 
teste ou confirmação sobre a validade do modelo teórico 
de mensuração. É muito diferente da EFA, a qual explora 
dados para identificar potenciais construtos. Muitos pes- 
quisadores conduzem EFA sobre uma ou mais amostras 
separadas antes de atingirem o ponto de tentarem confir- 
mar um modelo. A EFA é a ferramenta apropriada para 
identificar fatores entre múltiplas variáveis. Como tal, os 
resultado de EFA podem ser úteis no desenvolvimento de 
teoria que conduzirá a um modelo proposto de mensura- 
ção. É aqui que a CFA entra em jogo. Ela pode confirmar 
a mensuração desenvolvida usando-se EFA. 


Diagnóstico de problemas 

Ainda que a meta principal de CFA seja responder se um 
dado modelo de mensuração é válido, o processo de tes- 
te usando CFA fornece informação diagnóstica adicional 
que pode sugerir modificações para se tratar de proble- 
mas não resolvidos ou mesmo melhorar o teste da teoria 
de mensuração do modelo. 

Reespecificação de modelo, por qualquer motivo, 
sempre causa impacto na teoria subjacente sobre a qual 
o modelo foi formulado. Se as modificações forem peque- 
nas, então a integridade teórica de um modelo de mensu- 
ração pode não ser severamente danificada e a pesquisa 
pode prosseguir usando o modelo e os dados prescritos 
depois de fazer as mudanças sugeridas. Se as modificações 
forem mais significativas, o pesquisador deve estar dispos- 
to a modificar a teoria de mensuração, o que resultará em 
um novo modelo de mensuração e a princípio exigirá uma 
nova amostra de dados. Dada a forte base teórica para 
CFA, o pesquisador deve evitar mudanças baseadas so- 
mente em critérios empíricos, como os diagnósticos forne- 
cidos por CFA. Outras preocupações devem ser levadas 
em conta antes de se fazer qualquer alteração, incluindo a 
integridade teórica dos construtos individuais, do modelo 
de mensuração geral, e das suposições e orientações que 
acompanham a boa prática, assuntos já discutidos. 


Quais sinais diagnósticos são conseguidos quando se 
usa CFA? Eles incluem índices de ajuste, como aqueles 
já discutidos, e análises de resíduos, bem como alguma in- 
formação diagnóstica específica fornecida na maioria dos 
resultados de CFA. Muitos sinais diagnósticos são forne- 
cidos, e nos concentramos aqui naqueles que são úteis e 
fáceis de aplicar. Algumas áreas que podem ser usadas 
para identificar problemas com medidas são: 


1. Estimativas de caminhos 
2. Resíduos padronizados 
3. Índices de modificação 
4. Busca de especificação 


Estimativas de caminhos. Um dos jeitos mais fáceis 
para identificar um problema potencial com uma teoria 
de mensuração é a comparação das cargas estimadas — as 
estimativas de caminhos conectando construtos com variá- 
veis indicadoras. Anteriormente, fornecemos regras prá- 
ticas que sugerem que cargas devem ser de pelo menos 
0,5 e, idealmente, de 0,7 ou mais. Quando testa um mo- 
delo de mensuração, o pesquisador deve esperar encon- 
trar cargas relativamente elevadas. Afinal de contas, uma 
vez que CFA é usada, deve existir uma boa compreensão 
conceitual dos construtos e seus itens. Este conhecimento, 
com resultados empíricos preliminares de estudos explo- 
ratórios, deve fornecer essas expectativas. 

Diretrizes se fazem necessárias para ajudar na inter- 
pretação das estimativas de cargas fornecidas por pro- 
gramas SEM. Primeiro, as regras práticas se aplicam a 
estimativas completamente padronizadas de cargas. Tais 
estimativas removem efeitos decorrentes da escala das 
medidas, como as diferenças entre correlações e covari- 
âncias. Assim, o pesquisador deve se certificar de que elas 
estão incluídas no resultado final. A saída padrão geral- 
mente mostra as estimativas de máxima verossimilhança 
não-padronizadas, as quais são mais difíceis de interpretar 
com relação a essas orientações. 

Testes paramétricos da significância de cada coefi- 
ciente estimado (livre) também são dados. Estimativas 
insignificantes sugerem que um item deveria ser elimina- 
do. Reciprocamente, uma carga significante por si só não 
indica que um item está desempenhando adequadamente; 
uma carga pode ser significante a níveis marcantes de sig- 
nificância (ou seja, p < 0,01), mas ainda estar considera- 
velmente abaixo de 10,51. Cargas baixas sugerem que uma 
variável é candidata para eliminação do modelo. 

Cargas também devem ser examinadas quanto a indi- 
cações de problemas gerais. Uma estimativa transgressora 
pode se desenvolver de diversas maneiras. Uma estimati- 
va transgressora sugere que algum problema sério pode 
residir nos dados. Por exemplo, cargas completamente 
padronizadas acima de 1,0 ou abaixo de -1,0 estão fora 
do intervalo possível e são um importante indicador de 
um problema com os dados. O leitor pode consultar a dis- 
cussão sobre problemas em estimação de parâmetros para 
examinar o que esta situação pode significar para o mode- 


606 Análise Multivariada de Dados 


lo geral. É importante mostrar que o problema pode não 
estar somente na variável com a carga fora do intervalo. 
Assim, simplesmente eliminar este item pode não ser a 
melhor solução. Analogamente, o pesquisador deve exa- 
minar se as cargas fazem sentido. Por exemplo, itens com 
a mesma valência (p.ex., textos positivos ou negativos) 
devem produzir o mesmo sinal. Se uma escala de atitu- 
de consiste de respostas a quatro itens — bom, favorável, 
não-favorável, ruim — então dois itens devem ter cargas 
positivas e dois devem ter cargas negativas (a menos que 
eles tenham sido previamente recodificados). Se os sinais 
das cargas não forem opostos, o pesquisador não deve ter 
confiança nos resultados. 

Uma saída típica também mostra as correlações qua- 
dradas múltiplas para cada variável medida. Em um mo- 
delo CFA, este valor representa o grau em que a variân- 
cia da variável medida é explicada por um fator latente. 
Sob uma perspectiva de medição, isso representa o quão 
bem um item mede um construto. Correlações quadradas 
múltiplas são, às vezes, referidas como confiabilidade de 
item. Não fornecemos regras específicas para interpretar 
esses valores aqui porque em um modelo de mensuração 
congênere elas são uma função das estimativas de carga. 
Lembre-se que um modelo congênere é aquele no qual 
nenhuma variável medida carrega sobre mais de um cons- 
truto. As regras dadas para as estimativas de cargas fato- 
riais tendem a produzir o mesmo diagnóstico. 

Para resumir, as estimativas de cargas podem sugerir 
que se descarte um item particular ou que alguma estima- 
tiva transgressora indica um problema geral maior. 


Resíduos padronizados. A saída padrão produzida pela 
maioria dos programas SEM inclui resíduos. Resíduos se 
referem às diferenças individuais entre termos de cova- 
riância observada e os termos de covariância ajustada. 
Anteriormente, computamos os resíduos individuais para 
a CFA mostrada na Figura 11-4. Quanto melhor o ajuste, 
menores os resíduos. Assim, um termo residual exclusivo 
é associado com cada item exclusivo da matriz de cova- 
riância observada usada como entrada. Resíduos padro- 
nizados também são dados pela maioria dos programas 
SEM. Os resíduos padronizados são simplesmente os 
resíduos originais divididos pelo erro padrão do resíduo. 
Assim, eles não são dependentes do real intervalo da es- 
cala de medição, o que os torna úteis no diagnóstico de 
problemas com um modelo de mensuração. 

Resíduos podem ser positivos ou negativos, depen- 
dendo se a covariância estimada está abaixo ou acima da 
correspondente covariância observada. Pesquisadores 
podem usar esses valores para identificar pares de itens 
para os quais o modelo especificado de mensuração não 
recria com precisão a covariância observada entre aqueles 
dois itens. Tipicamente, resíduos padronizados menores 
que 12,5l não sugerem um problema. Reciprocamente, re- 
síduos maiores que 14,0] sinalizam um alerta vermelho e 


sugerem um grau de erro potencialmente inaceitável. A 
resposta mais provável, mas não automática, é eliminar 
um dos itens associados com um resíduo maior que 14,0]. 
Resíduos padronizados entre 12,51 e 14,0 merecem certa 
atenção, mas podem não sugerir quaisquer mudanças no 
modelo se nenhum outro problema for associado com 
aqueles dois itens. 


Índices de modificação. Uma típica saída SEM também 
lista índices de modificação. Um índice de modificação é 
calculado para cada relação possível que não é livre para 
ser estimada. Ele mostra quanto que o valor x” do modelo 
geral seria reduzido pela liberação daquele caminho em 
especial. Índices de modificação de aproximadamente 4 ou 
mais sugerem que o ajuste poderia ser melhorado signifi- 
cativamente pela liberação do caminho correspondente. 

Promover mudanças de modelo com base somente em 
índices de modificação não é recomendado, pois quan- 
do múltiplas modificações se fazem necessárias, algumas 
combinações de mudanças entre itens podem levar a um 
modelo melhor do que mudanças que resultariam com 
base no maior índice de modificação. Além disso, mudan- 
ças jamais devem ser feitas baseadas apenas no índice de 
modificação. Fazer isso seria inconsistente com a base teó- 
rica de CFA e SEM em geral. Pesquisadores devem con- 
sultar outros diagnósticos de resíduos para uma mudança 
sugerida por um índice de modificação e então tomar uma 
ação adequada, se justificada pela teoria. 


Buscas de especificação. Uma busca de especificação 
é uma abordagem empírica de tentativa e erro que usa 
diagnóstico de modelo para sugerir mudanças no modelo. 
Na realidade, quando realizamos mudanças com base em 
qualquer indicador diagnóstico, estamos executando uma 
busca de especificação [46]. Programas SEM como AMOS 
e LISREL podem executar automaticamente buscas de 
especificação. Essas buscas podem encontrar o conjunto 
de relações que melhor ajusta uma matriz de covariância 
com base em um processo de ajuste iterativo. Este proces- 
so é conduzido por mudanças sequenciais que se apóiam 
na liberação de elementos fixados com o maior índice de 
modificação. Buscas de especificação são razoavelmente 
fáceis de implementar. 

Apesar de poder ser tentador confiar amplamente em 
buscas de especificação como uma maneira de encontrar 
um modelo com um bom ajuste, esta abordagem não é re- 
comendada [32, 34]. Numerosos problemas podem surgir 
se resultados puramente empíricos são empregados para 
obter melhor ajuste. O maior problema é sua inconsis- 
tência com o propósito pretendido e com o uso de pro- 
cedimentos como CFA. Em primeiro lugar, CFA testa a 
teoria e é menos aplicável como ferramenta exploratória. 
Segundo, os resultados para um parâmetro dependem dos 
resultados da estimativa de outros parâmetros, o que tor- 
na difícil se certificar de que o verdadeiro problema com 
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um modelo é isolado nas variáveis sugeridas por um ín- 
dice de modificação. Em terceiro lugar, a busca empírica 
que usa dados simulados tem mostrado que buscas me- 
cânicas de especificação não são confiáveis na identifica- 
ção de um verdadeiro modelo e, assim, podem conduzir 
a resultados enganosos. Portanto, buscas de especificação 
de CFA envolvem a identificação apenas de um pequeno 
número de problemas importantes. Um pesquisador no 
modo exploratório pode usar buscas de especificação em 
maior escala na ajuda da identificação de uma teoria de 
mensuração plausível. Novas estruturas de construtos que 
são sugeridas com base em buscas de especificação devem 
ser confirmadas usando-se um novo conjunto de dados. 


Advertências na reespecificação do modelo. Que ti- 
pos de modificação são mais relevantes? A resposta a 
esta questão não é simples ou clara. Se diagnósticos de 
um modelo indicam a existência de algum fator novo não 
sugerido pela teoria original de mensuração, verificar tal 
mudança requer um novo conjunto de dados. Quando 
mais de duas de cada 15 variáveis medidas são eliminadas 
ou modificadas em relação ao fator que elas indicam, um 
novo conjunto de dados deve ser utilizado para mais in- 
vestigações. Em contrapartida, eliminar um ou dois itens 
de uma grande bateria de itens é menos conseqgiiente e o 
teste confirmatório pode não ser ameaçado. 

Como CFA testa uma teoria de mensuração, mudan- 
ças no modelo devem ser feitas somente após cuidadosa 
consideração. A modificação mais comum seria a elimi- 
nação de um item que não desempenhe bem em relação 
à integridade do modelo, ao ajuste dele ou à validade de 
construto. Às vezes, porém, um item pode ser mantido 
mesmo que a informação diagnóstica sugira que ele é pro- 
blemático. Por exemplo, considere um item com elevada 
validade de conteúdo (como “Eu estava muito satisfeito” 
em uma escala de satisfação) dentro de um modelo geral 
CFA com bom ajuste geral e forte evidência de validade 
de construto. Eliminá-lo não parece ser um bom negócio. 
Pode-se ganhar um pouco de ajuste com sacrifício de cer- 
ta consistência conceitual. Além disso, um item de desem- 
penho ruim pode ser mantido, às vezes, para satisfazer 
exigências de identificação estatística ou para atender à 
consideração do número mínimo de itens por fator. No fi- 
nal, porém, a teoria sempre deveria ser proeminentemen- 
te levada em conta ao se fazer modificações no modelo. 


Ilustração resumo. Usamos agora uma ilustração sim- 
ples não apenas para avaliar ajuste geral de um modelo 
de CFA, mas também para mostrar o uso de diversas 
medidas diagnósticas, incluindo resíduos, resíduos pa- 
dronizados e índices de modificação. A Figura 11-7 exi- 
be saídas selecionadas do teste de um modelo CFA que 
estende aquele mostrado na Figura 11-4. Um novo cons- 
truto, chamado de VALOR (HV), foi acrescentado. Ele 


representa o quanto de valor de prazer o consumidor 
recebeu de sua experiência no setor de compra. O ajus- 
te do modelo, como indicado pelo CFI e pela RMSEA, 
parece bom. O x do modelo é significante, o que é de se 
esperar, dado o grande tamanho da amostra (N = 800). 

Diversas observações complementares são possíveis 
baseadas na avaliação de medidas diagnósticas. Come- 
çamos olhando as cargas completamente padronizadas. 
Três das estimativas para HV ficam abaixo do corte de 
0,7, apesar de apenas uma ficar abaixo do corte menos 
conservador de 0,5 (HV5). Assim, HV5 se torna um 
principal candidato à eliminação. HV4 é suspeita, mas a 
menos que alguma outra evidência sugira que ela é pro- 
blemática, provavelmente ela será mantida. Para todos 
os fins práticos, a carga de HV3 é adequada, dado que 
ela é de apenas 0,01 a menos de 0,70. 

A seguir, examinamos os resíduos padronizados. Neste 
caso, todos os resíduos padronizados maiores do que 12,5 
são mostrados. Dois resíduos se aproximam, mas não exce- 
dem, 4,0. O maior, entre RADIANTE e ALEGRE (3,90), 
sugere que a estimativa de covariância entre os itens “ra- 
diante” e “alegre” poderia ser mais precisa. Neste caso, 
nenhuma mudança será feita com base neste resíduo, pois 
o ajuste se mantém bom a despeito do elevado resíduo. 
Eliminar radiante ou alegre deixaria menos do que qua- 
tro itens neste construto. Além disso, liberar o parâmetro 
correspondente à covariância de erro entre esses dois seria 
inconsistente com as propriedades congêneres do modelo 
de mensuração. Desse modo, parece que por enquanto po- 
demos viver com este resíduo de alguma forma elevado. 

O segundo resíduo alto está entre HV1 e HVS (-3,76). 
Ele oferece mais evidência (além de sua baixa carga pa- 
dronizada) de que HV5 pode precisar ser descartado. 

O terceiro diagnóstico que examinamos é o índice de 
modificação associado com cada caminho restrito. Aqui a 
informação é consistente com aquela obtida a partir dos 
resíduos certamente conduzindo à mesma conclusão. O 
índice de modificação para o termo de erro de radiante- 
alegre é 15,17. No entanto, dadas as elevadas estimativas 
de carga para cada, nenhuma modificação é feita. Além 
disso, não apenas há um elevado resíduo padronizado as- 
sociado com HVS5 (-3,76), mas um alto índice de modifi- 
cação também é encontrado entre HV5 e H1* (14,15), e 
sua carga está abaixo de 0,5. Com base nesses resultados, 
a única mudança que seria feita é a eliminação de HVS. 


Às vezes, diagnósticos sugerem substanciais mudanças 
em um modelo de mensuração. Quando as mudanças são 
marcantes, novos dados são necessários para validar tal 
modelo. Modificações significativas realmente produzem 
um novo modelo de mensuração. 


*N. de R.T.: A expressão correta seria HV1. 
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àx (Cargas completamente padronizadas) 


SENTIMENTO VALOR 
ANIMADO 0,78 -- 
ESTIMULADO 0,89 -- 
ALEGRE 0,83 -- 
RADIANTE 0,87 -- 
HVv1 -- 0,58 
HV2 -- 0,71 
HV3 -- 0,69 
Hv4 -- 0,52 
HV5 -- 0,46 
x? = 68,0 com 24 graus de liberdade (p = 0,000013) 
CFI = 0,99 
RMSEA = 0,04 
MAIORES RESÍDUOS PADRONIZADOS NEGATIVOS 
RESÍDUO PARA ALEGRE E ANIMADO 
RESÍDUO PARA RADIANTE E ESTIMULADO 
RESÍDUO PARA HV2 E RADIANTE 
RESÍDUO PARA HV5 E Hv1 
MAIORES RESÍDUOS PADRONIZADOS POSITIVOS 
RESÍDUO PARA ESTIMULADO E ANIMADO 
RESÍDUO PARA RADIANTE E ALEGRE 
RESÍDUO PARA HV1 E ANIMADO 
RESÍDUO PARA HV1 E ESTIMULADO 


Índices de modificação para estimativas de 


ANIMADO 
ESTIMULADO 
ALEGRE 
RADIANTE 


Hv1 
HV2 
HV3 
HVv4 
HV5 


SENTIMENTO 


4,09 
2,72 
0,04 
2,30 
2,06 


Índices de modificação para estimativas de 


ANIMADO 
ESTIMULADO 
ALEGRE 
RADIANTE 


Hv1 
HV2 
HV3 
HVv4 
HV5 


ANIMADO 


ESTIMULADO 


-3,12 
-3,04 
-2,70 
-3,76 


3705 
3,90 
3,08 
2,72 


cargas cruzadas 


termos de erro 


ALEGRE RADIANTE 


15,17 Es. 5 
2,62 1,86 
1,40 2,73 
0, 17 0,28 
3,82 0,06 
2,14 0,00 


Novo construto HV tem cinco 
variáveis indicadoras 


—ndices de ajuste 


Maiores resíduos padronizados 


negativos e positivos 


Índices de modificação 


FIGURA 11-7 Cargas, resíduos padronizados e índices de modificação em CFA. 
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REGRAS PRÁTICAS 11-5 


Avaliação da validade do modelo de mensuração 


e Estimativas de carga podem ser estatisticamente 
significantes, mas ainda serem muito pequenas para 
se qualificarem como bons itens (cargas padronizadas 
abaixo de |0,51); em CFA, itens com cargas pequenas se 
tornam candidatos à eliminação. 

e Cargas completamente padronizadas acima de 1,0 ou 
abaixo de —1,0 estão fora do intervalo viável e podem 
ser um importante indicador de algum problema com 
os dados 

e Tipicamente, resíduos padronizados menores do que 
2,5l não sugerem um problema: 

e Resíduos padronizados maiores do que 14,0] sugerem 
um grau de erro potencialmente inaceitável que 
pode pedir a eliminação de um item transgressor 


Resíduos padronizados entre 12,5] e 14,0! merecem 
alguma atenção, mas podem não sugerir qualquer 
mudança no modelo se nenhum outro problema 
estiver associado com os dois itens 


O pesquisador deve usar os índices de modificação 
somente como orientação para melhoramentos no 
modelo daquelas relações que podem ser teoricamente 
justificadas 

Buscas de especificação sustentadas somente em 

bases empíricas são desencorajadas, pois elas são 
inconsistentes com a base teórica de CFA e SEM 
Resultados CFA que sugerem modificações relevantes 
devem ser reavaliados com um novo conjunto de dados 
(p.ex., se mais de duas entre 15 variáveis medidas 

são descartadas, as modificações não podem ser 
consideradas irrelevantes) 


para a manutenção de empregados. Uma melhor com- 
preensão pode ser conseguida aprendendo como medir 
os construtos fundamentais. Assim, a HBAT está inte- 
ressada em desenvolver e testar um modelo de mensura- 
ção formado por construtos que afetam as atitudes e os 
comportamentos dos empregados sobre a permanência 
na HBAT. 


Estágio 1: Definição de construtos individuais 


Com a questão geral de pesquisa definida, o pesquisador 
volta sua atenção para a seleção dos construtos específicos 
que representam a estrutura teórica a ser testada e que 
devem ser incluídos na análise. Os indicadores específicos 
usados para operacionalizar tais construtos podem vir de 
pesquisa prévia ou podem ser desenvolvidos especifica- 
mente para a análise em mãos. 


A HBAT iniciou um projeto de pesquisa para estudar 
o problema de rotatividade de empregados. Pesquisas 
preliminares descobriram que muitos empregados estão 
somando opções de trabalho com a intenção de sair da 
HBAT assim que uma oferta aceitável seja conseguida 
com outra empresa. Para conduzir o estudo, a HBAT 
contratou consultores que têm um conhecimento profis- 
sional da teoria de comportamento organizacional refe- 
rente à retenção de empregados. Com base em litera- 
tura publicada e algumas entrevistas preliminares com 
empregados, um estudo foi planejado, focalizando cinco 
construtos fundamentais. A equipe de consultores e a 
administração da HBAT também concordaram com as 
definições de construtos com base em como eles foram 
usados no passado. Os cinco construtos, com uma defini- 


ILUSTRAÇÃO DA CFA 


Agora, ilustramos a CFA. Nesta seção, aplicamos o pro- 
cedimento de seis estágios em um problema defrontado 
pela administração de HBAT. Em uma seção posterior, 
cobrimos alguns dos tópicos avançados estendendo a aná- 
lise desses mesmos dados. Começamos introduzindo bre- 
vemente o contexto para este novo estudo da HBAT. 


A HBAT emprega milhares de pessoas em diferentes 
operações ao redor do mundo. Como em muitas firmas, 
um de seus maiores problemas administrativos é atrair 
e manter empregados produtivos. O custo para substi- 
tuir e treinar empregados é alto. No entanto, a pessoa 
recém contratada trabalha para a HBAT menos de três 
anos em média. Na maioria dos empregos, o primeiro 
ano não é produtivo, o que significa que o empregado 
não está contribuindo tanto quanto os custos associados 
com sua contratação. Depois do primeiro ano, a maioria 
dos empregados se torna produtiva. A administração da 
HBAT gostaria de entender os fatores que contribuem 


ção operacional, são os seguintes: 


e Satisfação com o emprego (JS). Reações resultantes de 
uma avaliação da situação empregatícia de alguém. 

e Compromisso organizacional (OC). O grau em que um 
empregado se identifica e se sente parte da HBAT. 

e Intenções de ficar (SI). O grau em que um empregado 
pretende continuar trabalhando para a HBAT e não 
está participando de atividades que tornam o pedido de 
demissão algo provável. 

e Percepções ambientais (EP). Crenças que um emprega- 
do tem sobre o dia-a-dia, sobre as condições físicas de 
trabalho. 

e Atitudes em relação a colegas (AC). Atitudes que um 
empregado tem em relação aos colegas com os quais ele 
normalmente interage. 


Os consultores propuseram um conjunto de escalas 
reflexivas de múltiplos itens para medir cada construto. 
A validade de expressão parece evidente, e as defini- 
ções conceituais correspondem bem com a descrição dos 
itens. Além disso, um pré-teste simples foi executado, no 


qual três especialistas independentes ligaram itens com 
(Continua) 
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(Continuação) : . 
os nomes dos construtos. Nenhum perito teve dificulda- 


de para ligar itens com construtos, fornecendo grande 
confiança de que as escalas contêm validade de expres- 
são. Tendo estabelecido validade de expressão, a HBAT 
prosseguiu para finalizar as escalas. A purificação de 
escalas baseada em correlações entre itens e total e re- 
sultados de EFA (como no Capítulo 3) de um pré-teste 
envolvendo 100 empregados da HBAT resultaram nas 
medidas mostradas na Tabela 11-1. A escala de satisfa- 
ção com emprego contém múltiplas medidas, com cada 
uma avaliando o grau de satisfação sentido pelos respon- 
dentes com um tipo diferente de escala. Um apêndice no 
final do capítulo mostra o questionário para este estudo. 


definidas, mas também a natureza de cada construto (re- 
flexiva versus formativa) é especificada. 


Estágio 2: Desenvolvimento do 
modelo de medida geral 


Com os construtos especificados, o pesquisador deve a 
seguir especificar o modelo de mensuração a ser testado. 
Fazendo isso, não apenas relações entre construtos são 


Um diagrama visual descrevendo o modelo de mensu- 
ração é exibido na Figura 11-8. O modelo retrata 21 va- 
riáveis indicadoras medidas e cinco construtos latentes. 
Sem motivo para pensar que os construtos são indepen- 
dentes, todos eles são considerados como correlaciona- 
dos entre si. Todos os itens medidos podem ter cargas 
sobre apenas um construto cada; logo, os termos de erro 
(não mostrados na ilustração) não devem se relacionar 
com qualquer outra variável medida, e o modelo de 
mensuração é congênere. Quatro construtos são indica- 
dos por quatro itens medidos, e um (JS) é indicado por 
cinco itens medidos. Cada construto individual é identi- 
ficado. O modelo geral tem mais graus de liberdade do 
que caminhos a serem estimados. Portanto, de uma ma- 
neira consistente com a regra prática que recomenda um 
mínimo de três indicadores por construto mas que enco- 
(Continua) 
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FIGURA 11-8 Modelo de teoria de mensuração para empregados da HBAT. 


Nota: Variáveis medidas são mostradas com uma caixa por rótulos correspondentes àqueles exibidos no questionário. Construtos latentes são 
mostrados com um oval. Cada variável medida tem um termo de erro (8) associado com ela. Esses termos de erro não são exibidos na figura para fins 
de simplificação. Conexões em dois sentidos indicam covariância entre construtos (&). Conectores de um só sentido indicam um caminho causal de um 


construto para um indicador. 


*N.de R.T.: A notação correta seria À yigs- 
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TABELA 11-1 | Indicadores observados usados em CFA de comportamento de empregados da HBAT 
Item Tipo de escala Descrição Construto 
JS1 Likert de 0-10 Levando tudo em conta, sinto-me muito satisfeito quando penso em meu emprego. JS 
Discorda-concorda 
OC1 Likert de 0-10 Meu trabalho na HBAT me dá uma sensação de realização. OC 
Discorda-concorda 
OC2 Likert de 0-10 Estou disposto a fazer um esforço maior, além do normalmente esperado, para OC 
Discorda-concorda ajudar a HBAT a ter sucesso. 
EP1 Likert de 0-10 Estou confortável com meu ambiente físico de trabalho na HBAT EP 
Discorda-concorda 
OC3 Likert de 0-10 Sinto lealdade para com a HBAT. OC 
Discorda-concorda 
OC4 Likert de 0-10 Sinto orgulho de dizer aos outros que trabalho para a HBAT. OC 
Discorda-concorda 
EP2 Likert de 0-10 O local onde trabalho é planejado para me ajudar a fazer meu trabalho melhor. EP 
Discorda-concorda 
EP3 Likert de 0-10 Há poucos obstáculos que podem me tornar menos produtivo em meu local de EP 
Discorda-concorda trabalho 
AC1 Likert de 5 pontos O quão feliz você está com o trabalho de seus colegas? AC 
Nada feliz Um pouco feliz Feliz Muito feliz Extremamente feliz 
EP4 Diferencial semântico de 7 Qual termo melhor descreve seu ambiente de trabalho na HBAT? EP 
pontos Muito frenético muito calmo 
JS2 Diferencial semântico Quando você pensa em seu trabalho, quão satisfeito você fica? JS 
de 7 pontos Nada satisfeito Muito satisfeito 
JS3 Diferencial semântico de 7 O quão satisfeito você está com seu atual trabalho na HBAT? JS 
pontos Muito insatisfeito Muito satisfeito 
AC2 Diferencial semântico de 7 Como você se sente em relação aos seus colegas? AC 
pontos Nada favorável muito favorável 
stá Likert de 5 pontos Atualmente não estou procurando outro emprego. Si 
Discordo — concordo Discordo fortemente Concordo fortemente 
JS4 Likert de 5 pontos Como empregado, o quão satisfeito você está com a HBAT? JS 
Nem um pouco um pouco médio bastante muitíssimo 
sI2 Likert de 5 pontos Raramente olho lista de empregos na internet Si 
Discordo — concordo Discordo fortemente concordo fortemente 
JS5 Percentual de satisfação Indique sua satisfação com seu emprego atual na HBAT preenchendo a lacuna com JS 
um percentual, sendo que 0% = Nada satisfeito e 100% = muitíssimo satisfeito 
AC3 Likert de 5 pontos Com que frequência você faz coisas com seus colegas em dias de folga? AC 
Nunca Raramente Ocasionalmente Frequentemente Quase sempre 
SI3 Likert de 5 pontos Não tenho interesse em procurar por um emprego no próximo ano. Si 
Discordo — concordo Discordo fortemente Concordo fortemente 
AC4 Diferencial semântico de 6 Geralmente, o quanto seus colegas se parecem com você? AC 
pontos Muito diferentes Muito parecidos 
sI4 Likert de 5 pontos Qual a possibilidade de que você estará trabalhando na HBAT pelos próximos 12 Si 


meses? 


Muito improvável Improvável É possível Provável Altamente provável 


(Continuação) 


raja pelo menos quatro, a condição de ordem é satisfei- 
ta. Em outras palavras, o modelo é super-identificado. 
Dado o número de indicadores e um tamanho suficiente 
da amostra, nenhum problema com a condição de classi- 
ficação é esperado também. Quaisquer problemas dessa 
natureza deveriam surgir durante a análise. 

No modelo proposto, todas as medidas são reflexivas. 
Ou seja, a direção de causalidade é do construto laten- 
te para os itens medidos. Por exemplo, o desejo de um 


empregado em pedir demissão tenderia a causar baixos 
escores em cada um dos quatro indicadores que carre- 
gam sobre o construto de Intenções de Ficar (SI). Cada 
construto também apresenta uma série de indicadores 
que compartilham uma base conceitual semelhante, e 
empiricamente eles tenderiam a caminhar juntos. Isto 
é, esperaríamos que quando um mudar, uma mudança 
sistemática ocorrerá no outro. Logo, o modelo de men- 
suração é teoricamente considerado como reflexivo. 
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Estágio 3: Planejamento de um estudo 
para produzir resultados empíricos 


O próximo passo demanda que o estudo seja planejado e 
executado para coletar dados para testar o modelo de men- 
suração. O pesquisador deve considerar questões como 
tamanho amostral e especificação do modelo, particular- 
mente na hora de estabelecer a identificação do modelo. 


A seguir, a HBAT planejou um estudo para testar o mo- 
delo de mensuração. O interesse da HBAT estava em 
seus empregados horistas, e não na sua equipe adminis- 
trativa. Logo, o departamento de pessoal da HBAT for- 
neceu uma amostra aleatória de 500 empregados. Os 500 
representam empregados de cada uma das divisões da 
HBAT, incluindo suas operações nos Estados Unidos, 
Europa, Ásia e Austrália. Quatrocentas respostas com- 
pletas foram obtidas. 

Se o modelo é super identificado, então, com base em 
pré-testes, espera-se que as comunalidades excedam 0,5, 
e podem exceder 0,6, e o tamanho da amostra deve ser 
adequado. Se o modelo tivesse alguns fatores sub-identi- 
ficados, ou se algumas comunalidades ficassem abaixo de 
0,5, então uma amostra maior seria necessária. O tama- 
nho da amostra é também suficiente para viabilizar es- 
timação de máxima verossimilhança. Diversas variáveis 
de classificação também foram coletadas com o questio- 
nário. Foi permitido aos empregados responderem os 
questionários no horário do expediente e devolverem 
os mesmos em anonimato. O exame inicial não mos- 
trou quaisquer problemas com dados perdidos. Apenas 
duas respostas incluíram dados perdidos. Em um caso, 
uma resposta fora do intervalo foi dada, a qual é tratada 
como uma resposta perdida. Usando nossa regra prática 
do capítulo anterior, o tamanho amostral efetivo usan- 
do PD (eliminação aos pares, também conhecida como 
tratamento totalmente disponível) é de 399, pois este é o 
número mínimo de observações para qualquer covariân- 
cia observada. 


Especificação do modelo 

Dependendo do programa computacional que você usa, 
diferentes abordagens são necessárias neste ponto. Dois 
dos pacotes computacionais mais populares serão discuti- 
dos, apesar de muitos outros poderem ser utilizados para 
obter resultados idênticos. 


Se você escolher o AMOS, então você começa usando 
a interface gráfica para desenhar o modelo descrito na 
Figura 11-8. Uma vez que o modelo é esboçado, você 
pode transportar as variáveis medidas para o modelo e 
processar o programa. Em contrapartida, se você optar 
por LISREL, pode então usar os menus drop-down para 


gerar a sintaxe que corresponde ao modelo de mensu- 
ração, ou esboçar tal modelo usando um diagrama de 
caminhos, ou escrever o código apropriado em uma ja- 
nela de sintaxe. Se uma das duas primeiras alternativas 
é escolhida, LISREL pode gerar a sintaxe do programa 
automaticamente. 


Identificação 

Uma vez que o modelo de mensuração é especificado, o 
pesquisador está pronto para estimar o modelo. O progra- 
ma SEM fornecerá uma solução para o modelo especifica- 
do se tudo estiver adequadamente especificado. O proce- 
dimento de estimação padrão é máxima verossimilhança, 
a qual será usada neste caso porque uma análise prelimi- 
nar dos dados leva a HBAT a acreditar que as proprie- 
dades de distribuição dos dados são aceitáveis para esta 
abordagem. O pesquisador agora deve escolher as demais 
opções que são necessárias para analisar adequadamente 
os resultados. Exemplos de algumas opções disponíveis 
para os programas LISREL e AMOS são apresentados 
nos apêndices no final deste capítulo. 


A Tabela 11-2 mostra uma parte inicial de uma saída 
dos resultados CFA para este modelo. Ela fornece uma 
maneira fácil para rapidamente examinar quantos graus 
de liberdade serão usados pelo modelo. Neste caso, 52 
parâmetros são livres para serem estimados. Dos 52 pa- 
râmetros livres, 16 são cargas fatoriais, 15 representam 
termos de variância e covariância fatorial, e 21 corres- 
pondem a termos de variância de erro. O número total 
de termos de variância e covariância únicos é: 


(21x22)12 = 231 


Como 231 é maior que 52, o modelo é identificado 
com respeito à condição de ordem. Ele inclui mais graus 
de liberdade do que parâmetros livres. Nenhum proble- 
ma surge com a condição de classificação para identifi- 
cação, pois temos pelo menos quatro indicadores para 
cada construto. Além disso, nosso tamanho amostral é 
suficiente, e assim acreditamos que o modelo convergirá 
e produzirá resultados confiáveis. Esta é uma maneira 
importante de verificar a especificação para evitar ou de- 
tectar potenciais problemas de identificação. 


Estágio 4: Avaliação da validade 
do modelo de medida 


Examinamos agora os resultados do teste dessa teoria de 
mensuração pela comparação do modelo de mensura- 
ção teórico com a realidade, como representada por esta 
amostra. Tanto o ajuste do modelo geral quanto os cri- 
térios para validade de construto devem ser examinados. 
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TABELA 11-2 Parâmetros livres no modelo CFA da HBAT 


Especificações de parâmetros 


H 


16 cargas fatoriais 
a serem estimadas, 

como mostrado pela 
contagem (números) 
1-16. 


14 


oo) 
H 
ho 
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15 termos de covariân- 
cia fatorial a serem esti- 
mados, como mostrado 
pelos números 17-31. 


EP 23 24 25 26 
AC 27 28 29 30 31 


21 termos de variância de erro 
serão estimados, como mos- 
trado pelos números 32-52. 
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Logo, revemos aqui estatísticas importantes de ajuste e as 
estimativas paramétricas. 


Ajuste geral 

A saída de CFA inclui muitos índices de ajuste. Não pe- 
dimos todos os possíveis índices de ajuste. Ao invés disso, 
nos concentramos nos valores GOF estratégicos usando 
nossas regras práticas para fornecer alguma avaliação de 
ajuste. Cada programa SEM (AMOS, LISREL, EOS etc.) 
inclui um conjunto ligeiramente diferente, mas todos eles 
contêm os valores importantes como a estatística x”, O 
CFle a RMSEA. Eles podem aparecer em uma ordem di- 
ferente ou talvez em um formato tabular, mas você pode 
achar informação suficiente para avaliar o ajuste de seu 
modelo em qualquer programa SEM. 


A Figura 11-9 mostra o resumo do ajuste geral forne- 
cido na saída de CFA. Números de linhas foram acres- 
centados para fins de referência. O x do modelo geral é 
229,95 com 179 graus de liberdade. O valor-p associado 


com este resultado é 0,0061. Este valor-p é significante. 
usando uma taxa de erro Tipo I de 0,05. Assim, a esta- 
tística de qualidade de ajuste x não indica que a ma- 
triz de covariância observada combina com a matriz de 
“covariância estimada dentro da variância amostral. No 


entanto, dados os problemas associados com o emprego 


deste teste sozinho e o tamanho efetivo da amostra de 
399, examinamos detalhadamente outras estatísticas de 
ajuste também. 

Nossa regra prática sugere que confiemos em pelo 
menos um índice de ajuste absoluto e um incremental, 
além do resultado de x. O valor para RMSEA, um índi- 
ce de ajuste absoluto, é de 0,027. Este valor parece bas- 
tante pequeno e está abaixo da orientação de 0,08 para 
um modelo de 21 variáveis medidas e uma amostra de 
399. Usando o intervalo de confiança de 90% para esta 
RMSEA, concluímos que o verdadeiro valor de RM- 
SEA está entre 0,015 e 0,036. Assim, até mesmo o limite 
superior de RMSEA é baixo neste caso. 

O CFI é um índice de ajuste incremental. Ele é de 
0,99, o que, assim como a RMSEA, excede as diretrizes 
de CFI para um modelo dessa complexidade e com esse 
tamanho amostral. Assim, este resultado sustenta o mo- 
delo também. 

Os resultados CFA sugerem que o modelo de mensu- 
ração da HBAT fornece um ajuste razoavelmente bom. 
Além disso, o uso de RMSEA e CFI satisfaz nossa regra 
prática de que um índice de má qualidade de ajuste e um 
índice de qualidade de ajuste sejam avaliados. Soma-se a 
isso o fato de que os outros valores de índices anterior- 
mente discutidos também sustentam o modelo. Por exem- 
plo, a SRMR é 0,035,0 GFI é 0,95, e o AGFI é 0,93. 


Estatística de qualidade de ajuste 


Graus de liberdade 179 
Função qui-quadrado de ajuste mínimo 
Parâmetro de não-centralidade estimado 


Intervalo de confiança de 90% para NCP 


229,95 
(NCP) 
(15,98; 


(P=0, 
50,95 


Raiz do erro 
Intervalo de 
Valor-p para 


quadrático médio de aproximação (RMSEA) 
confiança de 90% para RMSEA (0,015; 
teste de ajuste próximo (RMSEA < 0,05) 


(ECVI) 0,84 
(0,75; 0,95) 


Índice de validação cruzada esperado 
Intervalo de confiança de 90% para ECVI 
ECVI para modelo saturado = 1,16 

ECVI para modelo de independência 


20,28 


Qui-quadrado para modelo de independência com 210 graus de liberdade 


AIC de independência = 8072,24 

AIC do modelo = 333,95 

AIC saturado = 462,00 

índice de ajuste normado (NFI) = 0,97 

índice de ajuste não-normado (NNFI) = 0,99 

Índice de ajuste normado de parcimônia (PNFI) = 0,83 
índice de ajuste comparativo (CFI) = 0,99 

Índice de ajuste incremental (IFI) = 0,99 

índice de ajuste relativo (RFI) = 0,97 

N crítico (CN) = 381,03 

Raiz do resíduo quadrático médio (RMR*) = 0,086 

Raiz padronizada do resíduo médio (SRMR) = 0,035 
Índice de qualidade de ajuste (GFI) = 0,95 

Índice ajustado de qualidade de ajuste (AGFI) = 0,93 


FIGURA 11-9 Resumo do ajuste geral do CFA da HBAT. 


*N.deR.T.: A notação correta seria RMSR. 


0061) 


94,04) 


= 0,027 
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= 1,00 
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Validade de construto 

Para avaliar validade de construto, examinamos valida- 
de convergente, discriminante e nomológica. Validade 
de expressão, como anteriormente observado, foi esta- 
belecida com base no conteúdo dos itens corresponden- 
tes. 


Validade convergente. A CFA provê um domínio de 
informação usado na avaliação de validade convergen- 
te. Ainda que estimativas de carga fatorial de máxima 
verossimilhança não sejam associadas com um intervalo 
especificado de valores aceitáveis ou inaceitáveis, suas 
magnitudes, direções e significância estatística devem ser 
avaliadas. 


Começamos examinando as estimativas de cargas fato- 
riais. A Tabela 11-3 retrata as estimativas originais de 
carga de máxima verossimilhança e seus valores-t asso- 
ciados. Observe que alguns programas (AMOS) podem 
se referir a cargas fatoriais como pesos de regressão, e 
depende do usuário o reconhecimento de seus status 
como cargas fatoriais. Estimativas de cargas que são sig- 
nificantes fornecem um começo útil na avaliação da va- 
lidade convergente do modelo de mensuração. Todas as 
cargas são altamente significantes, como foi exigido para 
validade convergente. 


Estimativas de máxima verossimilhança são a opção 
padrão para a maioria dos programas SEM, incluindo 
AMOS e LISREL. Sugere-se que cargas padronizadas 
também sejam requisitadas. Usando esta informação, po- 
demos avaliar as cargas fatoriais individuais com relação 
aos critérios para validade de construto. Nossas orienta- 
ções são que todas as cargas devem ser de pelo menos 0,5, 
e preferencialmente 0,7, e que as medidas de variância 
extraída devam igualar ou exceder 50%, enquanto 70% 
é considerado como referência para confiabilidade de um 
construto. 


A Tabela 11-4 retrata cargas completamente padroniza- 
das (pesos de regressão padronizados, usando termino- 
logia AMOS). Quando nos referimos a estimativas de 
cargas nesses capítulos, nos referimos aos valores com- 
pletamente padronizados, exceto quando dissermos o 
contrário. A menor carga obtida é 0,58, conectando com- 
promisso organizacional (OC) com o item OC1. Duas 
outras estimativas de carga ficam abaixo do padrão 0,7. 
As estimativas de variância extraída e as confiabilidades 
de construtos são mostradas na parte de baixo da Tabe- 
la 11-4. As estimativas de variância extraída oscilam de 
51,9% para JS a 68,1% para AC. Todas excedem a regra 
prática de 50%. Confiabilidades de construto variam de 
0,83 para OC a 0,89 para SIe AC. Novamente, elas exce- 
dem 0,7, sugerindo confiabilidade adequada. Esses valo- 


res foram computados usando-se as fórmulas mostradas 
anteriormente no capítulo quando validade convergente 
foi discutida. Até o presente momento, programas SEM 
não fornecem rotineiramente tais valores. 

Deste modo, a evidência sustenta a validade conver- 
gente do modelo de mensuração. Apesar de essas três 
estimativas de cargas estarem abaixo de 0,7, duas delas 
estão pouco abaixo de 0,7, e a outra não parece ser sig- 
nificativamente danosa para o ajuste do modelo ou para 
a consistência interna. Todas as estimativas de variância 
extraída excedem 0,5* e todas as estimativas de confia- 
bilidade excedem 0,7. Além disso, o modelo se ajusta 
relativamente bem. Logo, todos os itens são mantidos 
neste ponto e uma evidência adequada de validade con- 
vergente é fornecida. 


Validade discriminante. Agora nos voltamos para a va- 
lidade discriminante. Primeiro, examinamos a covariância 
entre construtos. Após a padronização, as covariâncias 
são expressas como correlações. A abordagem conserva- 
dora para estabelecer validade discriminante compara as 
estimativas de variância extraída para cada fator com as 
correlações quadradas entre construtos associadas com 
aquele fator. 


Todas as estimativas de variância extraída da Tabela 
11-4 são maiores do que as estimativas correspondentes 
de correlação quadrada entre construtos na Tabela 11-5 
(acima da diagonal). Portanto, este teste não sugere pro- 
blemas com validade discriminante. 


Todos os programas SEM fornecem as correlações de 
construtos, sempre que resultados padronizados são exi- 
gidos. Alguns (LISREL) terão um texto de saída padrão 
que as imprime como uma matriz de correlação real. Ou- 
tros (como AMOS) podem simplesmente listá-las no tex- 
to de saída. A informação é a mesma. 


O modelo de mensuração congênere também sustenta 
validade discriminante, pois ele não contém quaisquer 
cargas cruzadas entre as variáveis medidas ou entre os 
termos de erro. Este modelo congênere de mensuração 
oferece um bom ajuste e mostra pouca evidência de car- 
gas cruzadas substanciais. Tomados juntos, esses resul- 
tados sustentam a validade discriminante do modelo de 
mensuração da HBAT. 


Validade nomológica. A avaliação de validade nomo- 
lógica é baseada na abordagem delineada no Capítulo 3 
sobre EFA. A matriz de correlação fornece um começo 
útil neste esforço no sentido de que se espera que cons- 
trutos se relacionem entre si. Pesquisas anteriores sobre 


*N. de R.T.: A expressão correta seria 50%. 
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TABELA 11-3 Estimativas de cargas fatoriais de CFA da HBAT e valores-t 


LAMBDA -X 
Estimativas de máxima verossimilhança 
JS oc SI EP AC 
31 0 1,00 CREA RS ERR o SE 
JsS2 1,03 are e EE a Para cada parâmetro livre, uma estimati- 


va da relação é dada. A primeira linha é 
a estimativa, a segunda é o erro padrão, 


So e aterceira é o valor-t para a estimativa. 
JS3 0,90 -- -- = = == 
(0,07) 
12,49 
Js4 0,91 -- -- - - - = 
(0,07) 
12,93 
JS5 1,14 -- -- = = = e 
(0,09) 
13,38 
oc1 -- 1,00 -- - - - = 
0Cc2 -- 1,31 -- - - - = 
(0,11) 
12,47 
0C3 -- 0,78 -- - - - = 
(0,08) 
10,30 
oc4 -- 1,17 -- - - - = 
(0,10) 
11,94 
SI1 -- -- 1,00 -- -- 
SI2 -- -- 1,07 -- - - 
(0,07) 
16,01 
S1I3 -- -- 1,06 -- - - 
(0,07) 
16,01 
sI4 -- -- 1,17 -- -- 
(0,06) 
19,18 
EP1 -- -- -- 1,00 -- 
EP2 -- -- -- 1,03 -- 
(0,07) 
14,31 
EP3 -- -- -- 0,80 -- 
(0,06) 
13,68 
EP4 -- -- -- 0,90 -- 
(0,06) 
14,48 
Ac1 -- -- -- -- ,00 
AC2 -- -- -- -- 1,24 
(0,06) 
18,36 
AC3 -- -- -- -- 1,04 
(0,06) 
18,82 
Ac4 -- -- -- -- 1,15 
(0,06) 


18,23 
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TABELA 11-4 Cargas fatoriais completamente padronizadas da HBAT e estimativas de variância extraída, e de confiabilidade 


JS oC | EP AC 
JS1 0,74 
JS2 0,75 
JS3 0,68 
JS4 0,70 
JS5 0,73 
OC1 0,58 
OC2 0,88 
OC3 0,66 
OC4 0,84 
sá 0,81 
Computada usando a S12 0,86 
fórmula anterior como a s13 074 
carga fatorial quadrática , 
média (correlação múlti- S14 0,85 
pla quadrada). EP1 0,70 
EP2 0,81 
EP3 0,77 
EP4 0,82 
AC1 0,82 
AC2 0,82 
Computada usando a AC3 0,84 
fórmula anterior coma AC4 0,82 
soma quadrática das 
cargas fatoriais. variância 51,9% 56,3% 66,7% 60,3% 68,1% 
extraída 
Ni Confiabilidade 0,84 0,83 0,89 0,86 0,89 
de construto 
TABELA 11-5 Matriz de correlações de construtos da HBAT (padronizada) 
JS [ojo Si EP AC 
JS 1,00 0,04 0,05 0,06 0,00 
8,02 
OC 0,21 1,00 0,30 0,25 0,09 
3,38 6,04 
Si 0,23 0,55 1,00 0,31 0,10 
3,82 7,17 9,50 
EP 0,24 0,50 0,56 1,00 0,06 
3,88 6,47 7,75 7,54 
AC 0,05 0,30 0,31 0,25 1,00 
0,87 4,83 5,15 4,20 9,64 


Nota: Valores abaixo da diagonal são estimativas de correlação com valores-t mostrados em itálico na linha abaixo. Os valores-t para os elementos da diagonal são 
aqueles para os termos de variância de construto. Valores acima da diagonal são correlações quadradas. 


comportamento organizacional sugerem que geralmen- 
te espera-se que avaliações mais favoráveis de todos os 
construtos produzam resultados positivos de emprega- 
dos. Por exemplo, espera-se que esses construtos sejam 
positivamente relacionados se um empregado deseja 
ficar na HBAT. Além disso, é mais provável que empre- 
gados satisfeitos continuem a trabalhar para a mesma 
companhia. Mais importante, essa relação simplesmente 


faz sentido. 


Correlações entre os escores fatoriais para cada cons- 
truto são mostrados na Tabela 11-5. Os resultados sus- 
tentam a previsão de que esses construtos são positiva- 
mente relacionados entre si. Especificamente, satisfação, 
compromisso organizacional, percepções ambientais e 
atitudes para com colegas apresentam correlações po- 
sitivas significantes com intenções de permanência. Na 


verdade, apenas uma correlação é inconsistente com 
(Continua) 
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esta previsão. A estimativa de correlação entre AC e 


JS é positiva, mas não significante (t = 0,87). Como as 
demais correlações são consistentes, esta única exceção 
não é uma preocupação importante. 


A validade nomológica também pode ser sustentada 
pela demonstração de que os construtos são relacionados 
com outros construtos não incluídos no modelo de uma 
maneira que sustenta a estrutura teórica. Aqui o pesqui- 
sador deve escolher construtos adicionais que descrevam 
relações fundamentais na estrutura teórica em estudo. 


Além das variáveis medidas usadas como indicadores 
para os construtos, diversas variáveis de classificação fo- 
ram coletadas, como idade do empregado, sexo e anos 
de experiência. Além disso, o desempenho de cada em- 
pregado foi avaliado pela administração em uma escala 
de 5 pontos que varia de 1 = “Desempenho Fraquíssi- 
mo” a 5 = “Desempenho Excelente”. A administração 
forneceu esta informação aos consultores que, em segui- 
da, as inseriram no banco de dados. 

As demais medidas são úteis para estabelecer va- 
lidade nomológica. Pesquisa anterior sugere que de- 
sempenho no emprego é determinado pelas condições 
de trabalho de um empregado [2, 43]. A relação entre 
desempenho e satisfação com o trabalho é geralmente 
positiva, mas usualmente não é uma relação forte. Uma 
relação positiva entre compromisso e desempenho tam- 
bém é esperada. Em contrapartida, a relação entre de- 
sempenho e permanência na empresa não é tão clara. 
Empregados com melhor desempenho tendem a ter 
mais oportunidades de trabalho que podem cancelar os 
efeitos de “empregados com melhor desempenho estão 
mais confortáveis com o trabalho”. Uma relação positiva 
entre percepção ambiental e desempenho no trabalho é 
esperada, pois as condições de trabalho de alguém con- 
tribuem diretamente em como este alguém desempenha 
uma função. Também esperamos que experiência seja 
associada com intenções de permanência. Assim, quan- 
do intenções de permanência são maiores, um empre- 
gado está mais propenso a ficar em uma organização. 
Idade e intenções de permanência provavelmente não 


se relacionam fortemente. Empregados que se aproxi- 
mam da aposentadoria são relativamente mais velhos e 
poderiam possivelmente relatar intenções menores de 
permanecer. Este resultado interfere com uma relação 
positiva entre idade e intenções de permanência que po- 
deria, porventura, existir. 

Correlações entre esses três itens e os escores fato- 
riais para cada construto do modelo de mensuração fo- 
ram computadas usando-se SPSS. A Tabela 11-6 mostra 
os resultados. Correlações correspondendo às previsões 
feitas no parágrafo anterior podem ser comparadas com 
os resultados. Esta comparação mostra que as correla- 
ções são consistentes com as expectativas teóricas des- 
critas. Logo, tanto a análise das correlações entre os 
construtos do modelo de mensuração quanto a análise 
de correlações entre esses construtos e demais variáveis 
sustentam a validade nomológica do modelo. 


Modificação do modelo de medida 


Além de avaliar estatísticas de qualidade de ajuste, o pes- 
quisador deve verificar também diversos diagnósticos de 
modelo. Eles podem sugerir alguma forma de melhorar 
o modelo ou, talvez, alguma área específica de problema 
não revelada até então. As seguintes medidas diagnósti- 
cas de CFA devem ser verificadas. 


1. Estimativas de caminho 
2. Resíduos padronizados 
3. Índices de modificação 


Estimativas de caminho 
A SEM fornece estimativas de cada caminho especificado. 
Neste caso, a ênfase é dada nas cargas de cada indicador 
sobre um construto. 


Resultados são positivos neste ponto. No entanto, mes- 
mo com boas estatísticas de ajuste, a análise da HBAT é 
bem orientada para verificar os diagnósticos de modelo. 
As estimativas de caminho já foram examinadas. Uma 
estimativa de carga — o 0,58 associado com OC1 — foi 
notada porque ela ficou abaixo do corte de carga de 0,7. 
Não parecia causar problemas, porém, pois o ajuste se 


(Continua) 
TABELA 11-6 Correlações entre construtos e idade, experiência e desempenho no trabalho 
JS fofo si EP AC 
Desempenho no trabalho (JP) 0,15 0,27 0,10 0,29 0,06 
(0,003) (0,000) (0,041) (0,000) (0,216) 
Idade 0,14 0,12 0,06 —0,01 0,15 
(0,005) (0,021) (0,233) (0,861) (0,003) 
Experiência (EXP) 0,08 0,07 0,15 0,01 0,12 
(0,110) (0,159) (0,004) (0,843) (0,018) 


Nota: Valores-p mostrados entre parênteses. 
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manteve elevado. Se outra informação diagnóstica suge- 


rir um problema com esta variável, alguma ação pode 
ser necessária. 


Resíduos padronizados 

O resultado de SEM pode produzir uma lista de todos os 
resíduos e resíduos padronizados. No entanto, esta opção 
deve geralmente ser requisitada na maioria dos programas 
de SEM. O resultado padrão mostra apenas os maiores 
resíduos, ainda que um termo de resíduo seja computado 
para cada termo de covariância e variância na matriz de 
covariância observada. 


Este exemplo inclui 231 resíduos. Resíduos padroni- 
zados são produzidos para cada termo de covariância, 
resultando em 210 resíduos deste tipo. Não mostramos 
todos eles aqui. A saída padrão convenientemente exibe 
na tela os resíduos e fornece uma lista em separado dos 
maiores resíduos padronizados. No exemplo da HBAT, 
os resíduos padronizados a seguir foram identificados: 


Maiores resíduos padronizados negativos: 


Resíduos para SI3 e oc1 —2,68 
Resíduos para SI4 e oci -—2,74 
Resíduos para EP3 e oc1 =22.59 
Maiores resíduos padronizados positivos: 
Resíduos para SI2 e sI1 3,80 
Resíduos para SI4 e S1I3 3,07 
Resíduos para EP2 e 0c3 2,98 
Resíduos para EP4 e 0c3 2,88 
Resíduos para EP4 e EP3 3,28 


A lista inclui todos os resíduos padronizados cujos 
valores absolutos excedem |2,51. Nenhum resíduo padro- 
nizado tem seu valor absoluto excedendo 14,0], o valor 
de referência que pode indicar um problema com uma 
das medidas. Aqueles cujos valores absolutos estiverem 
entre 12,51 e 14,0l também podem merecer atenção se os 
outros diagnósticos igualmente apontarem um proble- 
ma. O maior resíduo é de 3,80 para a covariância entre 
SD e SI1. Ambas as variáveis têm uma estimativa de car- 
ga maior do que 0,8 sobre o SI. Este resíduo pode ser 
explicado pelo conteúdo dos itens. Neste caso, SI2 e SIL 
podem ter um pouco mais em comum entre si em termos 
de conteúdo do que cada uma em relação a SI3 e SI4, os 
outros dois itens que representam SI. 

O analista da HBAT decide não agir neste caso, dada 
a alta confiabilidade e elevada variância extraída para o 
construto. Além disso, o ajuste do modelo não sugere 
uma grande necessidade de melhora. Três dos mais altos 
resíduos negativos são associados com a variável OCI1, 
a qual também é a variável com a menor estimativa de 
carga (0,58). Novamente, nenhuma ação é assumida até 
este ponto, dados os resultados positivos gerais. No en- 
tanto, se o valor absoluto de um resíduo associado com 


OCI1 excedesse 4,0, ou se o ajuste do modelo fosse mar- 
ginal, OC1 seria um forte candidato para ser descartado 
do modelo. Neste caso, a representação congênere, que 
atende aos padrões da prática da boa medição, parece 
ajustar-se bem. 


Índices de modificação 

Se a opção de índice de modificação (MI) é solicitada, a 
saída incluirá uma lista de índices de modificação, com 
um índice para cada parâmetro fixado. Assim, índices de 
modificação são dados para cada carga fatorial possível 
para a qual nenhuma estimativa foi obtida. Analoga- 
mente, um índice de modificação é fornecido para cada 
elemento de variância-covariância de erro fora da diago- 
nal, com todos fixados em zero, como é padrão na con- 
dução da CFA. A saída inclui também uma “mudança 
esperada” para cada índice de modificação, mostrando 
quanto da estimativa do parâmetro mudaria se ele fosse 
liberado. Você pode perceber que muito da saída é pro- 
duzido de forma rápida. Não obstante, convenientemen- 
te, a maioria dos programas SEM lista o maior índice de 
modificação. 


Em nosso exemplo, a informação a seguir é dada: 


Máximo índice de modificação é 14,44 para 
elemento (12 10) de THETA-DELTA 


Isso é associado com uma covariância de erro espe- 
cífica (SIl e SD). Aqui, a fonte da melhora potencial é 
identificada como associada com THETA-DELTA, a 
covariância entre termos de erro. LISREL identifica a 
fonte de cada MI dessa maneira. AMOS simplesmente 
lista todos os MIs associados com qualquer covariância 
em uma só lista. Novamente, MIs são fornecidos para 
cada parâmetro fixado. Isso pode então ajudar a locali- 
zar este valor específico na lista de MIs, sendo que uma 
pequena parte disso é mostrada aqui: 


Índices de modificação para THETA-DELTA 


oc2 = E 

0c3 6,10 = E 

oc4 0,28 1,41 E 

sI1 0,28 2,96 0,30 Eis ni 

S1I2 3,57 0,08 172 14,44 —- 

S1I3 0,00 0,29 0,44 1; 97 1,82 E ds 
S1I4 0,01 0,91 1,69 5,77 3,08 9,42 


Um índice de modificação grande assim sugere que o 
ajuste pode ser melhorado liberando-se o parâmetro de 
covariância de erro correspondente entre os termos de 
erro para as variáveis medidas SI1 e SI2. O tamanho da 
estimativa de parâmetro que resultaria se este elemento 


(Continua) 
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fosse liberado é mostrado nas listas de mudanças espera- 
das. Uma pequena parte é dada aqui: 


Mudança esperada completamente padronizada 
para THETA-DELTA 


oc2 oc3 oc4 SI1 SI2 S1I3 


oc2 ae 

0c3 -0,31 -- 

oc4 -0,11 0,14 = - 

s11 0,02 —-0,06 0,02 - = 

SI2 0,07 0,01 -0,05 0,08 E 

SI3 0,00 —0,03 —0,03 —0,03 —0,03 -- 
sI4 0,00 —0,04 0,05 —0,05 —-0,04 0,08 


A mudança esperada mostra que liberar o parâmetro 
entre SIl e SI2 produziria uma mudança na estimativa 
completamente padronizada de 0,08. Como é fixada em 
zero em nosso modelo CFA, a mudança esperada tam- 
bém significa que a estimativa do parâmetro seria de 
0,08. Logo, é muito pequena relativamente às estimati- 
vas de carga para SIl e S2. Além disso, não recomenda- 
mos a liberação de termos de covariância de erro, pois 
isso viola os princípios da boa medição. O fato de que o 
ajuste é bom, junto com a evidência de validade de cons- 
truto, sugere que nenhuma mudança se faz necessária. 

Uma busca de especificação posterior também é 
desnecessária. Além disso, uma busca de especificação 
automática não é necessária porque o modelo tem uma 
sólida fundamentação teórica, e porque a CFA está 
testando, e não desenvolvendo um modelo. Se o ajuste 
fosse ruim, porém, uma busca de especificação poderia 
ser feita, como anteriormente descrito neste capítulo. 
Tal esforço se valeria consideravelmente dos diagnósti- 
cos combinados fornecidos pelas estimativas de cargas 
fatoriais, pelos resíduos padronizados e pelos índices 
de modificação. Entre esses, os resíduos padronizados 
frequentemente se mostram muito úteis. Neste ponto, a 
HBAT pode prosseguir com a confiança de que o ques- 
tionário mede bem esses construtos fundamentais. 


Resumo 


Quatro estágios de SEM estão completos. Os resultados 
de CFA, em geral, sustentam o modelo de mensuração. 
A estatística X é significante acima do nível de 0,01, o 
que não é incomum, dada uma amostra total de 400 (com 
um tamanho amostral efetivo de 399 usando a aborda- 
gem totalmente disponível). Tanto CFI quanto RMSEA 
parecem bastante bons. No geral, as estatísticas de ajuste 
sugerem que o modelo estimado reproduz a matriz de 
covariância amostral razoavelmente bem. Além disso, 
há evidência de validade de construto em termos de va- 
lidade convergente, discriminante e nomológica. Assim, 
a HBAT pode estar razoavelmente confiante, neste pon- 


to, de que as medidas se comportam como deveriam em 
termos de unidimensionalidade das cinco medidas e na 
maneira como os construtos se relacionam com outras 
medidas. Lembre-se, porém, que mesmo um bom ajus- 
te não é garantia de que alguma outra combinação das 
21 variáveis medidas não forneceria um ajuste igual ou 
melhor. O fato de que os resultados são conceitualmente 
consistentes é até mesmo de maior importância do que 
os resultados de ajuste em si. 


TÓPICOS AVANÇADOS EM CFA 


Esta seção cobre alguns tópicos importantes que estão 
além do teste de um modelo convencional de mensuração. 
Os assuntos incluem modelos fatoriais de ordem superior, 
testes de diferenças ao longo de múltiplos grupos, viés de 
mensuração, e parcelamento de itens. Essas discussões 
são então seguidas de várias ilustrações empíricas dos tó- 
picos, utilizando a base de dados HBAT SEM. 


Análise fatorial de ordem superior 


O modelo CFA descrito na Figura 11-4 é um modelo fato- 
rial de primeira ordem. Temos um modelo fatorial de pri- 
meira ordem quando as covariâncias entre itens medidos 
são explicadas com uma única camada de fatores latentes. 
Por enquanto, pense em uma camada como um nível de 
construtos latentes. 

Pesquisadores cada vez mais empregam análises fato- 
riais de ordem superior, apesar de este aspecto da teoria 
de mensuração não ser novo [29]. CF As de ordem superior 
frequentemente testam uma estrutura fatorial de segunda 
ordem que contém duas camadas de construtos latentes. 
Elas introduzem um fator latente de segunda ordem que 
é a causa de múltiplos fatores latentes de primeira ordem, 
os quais, por sua vez, são a causa das variáveis medidas 
(x). Teoricamente, este processo pode ser estendido para 
qualquer quantia de camadas. Daí o termo análise fatorial 
de ordem superior. Pesquisadores raramente investigam 
teorias além de um modelo de segunda ordem. A Figura 
11-10 contrasta os diagramas de caminhos de um modelo 
fatorial convencional de primeira ordem com uma cama- 
da na parte (a) e com um modelo fatorial de segunda or- 
dem com duas camadas na parte (b) [4]. 


Preocupações de ordem empírica 

Tanto considerações teóricas quanto empíricas estão as- 
sociadas com CFA de ordem superior. Todos os modelos 
CFA devem explicar relações entre construtos. Empiri- 
camente, fatores de ordem superior podem ser pensados 
como uma maneira de explicar covariância entre constru- 
tos da mesma forma que fatores de primeira ordem expli- 
cam covariação entre variáveis observadas [4]. A Figura 
11-10a mostra um modelo fatorial convencional com seis 
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(a) Modelo de primeira ordem 


Ds 


(b) Modelo de segunda ordem 


Camada? —— +» 


Camada 1 
ac 
x | [x | [x É x | [ x, [% X Xo | [Xi | [X | | Xa E [a Xe] [Xe 
Legenda: 


Fatores de primeira ordem: 
= R&T (Percepções de responsabilidade e confiança) 


n = PB (Percepções comportamentais de colegas) 
= EN (Percepções de normas éticas) 
= SP (Percepções de práticas de vendas) 


Fatores de segunda ordem: 
E = EC (Clima ético) 


FIGURA 11-10 Contraste de diagramas de caminhos para uma teoria de mensuração de primeira e de segunda ordem. 


Nota: Termos de erro não são mostrados para fins de simplificação. Cada caminho de um fator de primeira ordem para um item medido também tem uma 


estimativa correspondente de carga (x), que não é exibida. 


covariâncias entre quatro fatores latentes (D,,... D,,). 
Em um modelo CFA de primeira ordem, esses termos de 
covariância deveriam ser livres (estimados), a não ser que 
o pesquisador tenha uma forte razão para teorizar dimen- 
sões independentes. O pressuposto básico é de relações 
entre construtos. Essas relações se tornam o principal in- 
teresse quando passamos de CFA para SEM no Capítulo 
12. Um modelo de mensuração de primeira ordem explica 
essas relações simplesmente estimando cada uma direta- 
mente via elementos livres em uma matriz de covariância/ 
correlação de construtos (setas em dois sentidos). 

Em contrapartida, um modelo fatorial de segunda or- 
dem explica covariação entre construtos especificando ou- 
tro fator de ordem superior ou fatores que causam fatores 
de primeira ordem. Em outras palavras, os fatores de pri- 
meira ordem agora atuam como indicadores do fator de 
segunda ordem. A Figura 11-10b descreve um fator de se- 
gunda ordem (EC) que explica quatro fatores de primeira 
ordem (R&T, PB, EN e SP), cada um indicado por quatro 


itens reflexivos. Todas as considerações e regras práticas 
(itens por fator, identificação, escala etc.) se aplicam a fa- 
tores de segunda ordem, assim como se faz com os de pri- 
meira ordem; só que agora o pesquisador deve considerar 
os construtos de primeira ordem como indicadores do de 
segunda ordem. 


Preocupações de caráter teórico 

Teoricamente, às vezes construtos podem ser operaciona- 
lizados em diferentes níveis de abstração. Cada camada 
na Figura 11-10b se refere a um nível diferente de abs- 
tração. Discutimos dois exemplos que ilustram o papel de 
fatores de segunda ordem. 


Muitos construtos psicológicos podem ser representados 
em diferentes níveis de abstração. Personalidade pode 
ser representada por numerosos fatores de primeira or- 
dem relacionados entre si. Cada um pode ser medido 
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usando-se dúzias de escalas de múltiplos itens que fazem 
uso de uma dimensão específica de personalidade. Cons- 
trutos psicológicos incluem escalas para ansiedade, pes- 
simismo, criatividade, imaginação e auto-estima, entre 
muitas outras. Alternativamente, os fatores de primeira 
ordem podem ser vistos como indicadores de um con- 
junto menor de fatores de ordem superior mais abstratos 
que refletem orientações de personalidade mais abstra- 
tas e amplas, como extroversão, neurose, consciência, 
concordância e intelecto [10, 45]. Estes construtos mais 
abstratos de personalidade são, às vezes, conhecidos 
como os “cinco grandes” fatores de personalidade. 

Analogamente, pode-se imaginar que muitos fatores 
distintos podem indicar o desempenho de alguém em 
um curso de pós-graduação. Múltiplos indicadores de 
um teste padronizado poderiam ser usados para repre- 
sentar desempenhos verbal e quantitativo, entre outras 
características de exames. Múltiplos itens também po- 
deriam ser utilizados para avaliar o desempenho de um 
candidato na escola, incluindo GP As no ensino superior, 
GPAs no ensino médio, e talvez outros instrumentos de 
avaliação que fazem uso de notas. Poderíamos usar tam- 
bém escalas de múltiplos itens para avaliarmos a motiva- 
ção de uma pessoa para ser bem sucedida na pós-gradu- 
ação. Uma vez que concluímos isso, podemos finalizar 
com umas poucas dúzias de variáveis indicadoras para 
diversos fatores como compreensão de leituras, habili- 
dade quantitativa, resolução de problemas, desempenho 
escolar e desejo. Cada um desses aspectos é por si só um 
fator. Contudo, todos eles podem ser conduzidos por um 
fator de ordem superior que poderíamos rotular como 
“Possibilidade de sucesso”. Pode ser difícil olhar as cre- 
denciais de alguém e avaliar diretamente a possibilidade 
de sucesso. No entanto, isso pode ser muito bem indica- 
do por fatores mais tangíveis, como a habilidade de re- 
solver problemas. No final, decisões importantes podem 
ser tomadas com base no fator de sucesso mais abstrato, 
e, espera-se, tais decisões serão melhores do que confiar 
nos fatores individuais mais específicos. Assim, os fato- 
res individuais são de primeira ordem, e Possibilidade 
de Sucesso poderia ser considerado como um fator de 
segunda ordem. Este tipo de situação requer o teste de 
um modelo CFA de segunda ordem. 


Jamais é exagerado afirmar que o critério final para 
decidir formar um modelo de mensuração de segunda or- 
dem é teoria. Isso faz sentido teórico? Quais são as razões 
lógicas que nos levam a esperar por camadas de constru- 
tos? O crescente número de modelos fatoriais de segunda 
ordem percebidos na literatura é parcialmente o resultado 
de mais pesquisadores aprendendo a usar SEM para re- 
presentar e testar uma estrutura fatorial de ordem supe- 
rior. A habilidade de conduzir um teste de segunda ordem 
não é justificativa para fazê-lo. A necessidade de teoria é 
particularmente verdadeira quando se tenta decidir entre 


uma configuração fatorial de primeira e de segunda or- 
dem para uma dada teoria de mensuração. 


Uso de teorias de mensuração de segunda ordem 

A especificação de um modelo CFA de segunda ordem 
é, na verdade, bastante parecida com a de um modelo de 
primeira ordem, se olharmos os construtos de primeira 
ordem como indicadores. Modelos fatoriais de primei- 
ra ordem explicam covariância entre construtos latentes 
melhor do que uma representação de ordem superior dos 
mesmos dados. Considerando a Figura 11-10a, o modelo 
de primeira ordem estima uma relação (um caminho de 
dois sentidos, neste caso) para cada covariância em po- 
tencial. O modelo de ordem superior na Figura 11-10b 
explica essas seis relações com quatro cargas fatoriais. A 
despeito de a comparação entre um modelo de mensura- 
ção de primeira ordem e um de segunda ser geralmente 
por acoplamento, a comparação empírica usando uma 
estatística Ay não é tão útil quanto a comparação entre 
modelos de mensuração concorrentes de mesma ordem 
[36]. O modelo de primeira ordem sempre se ajustará me- 
lhor em termos absolutos, pois ele usa mais caminhos para 
capturar o mesmo tanto de covariância. 

Em compensação, o modelo de ordem superior é mais 
parcimonioso (ele consume menos graus de liberdade). 
Logo, ele deve desempenhar melhor em índices que re- 
fletem parcimônia (PNFI, RMSEA etc.). Note, porém, 
que ainda que um modelo de ordem superior seja mais 
parcimonioso do ponto de vista de graus de liberdade, 
ele não é “mais simples”, pois envolve múltiplos níveis 
de abstração. Isso complica comparações empíricas e, 
assim, coloca maior peso sobre preocupações teóricas e 
pragmáticas. 

Exatamente como foi exigido na especificação de cada 
construto de primeira ordem, a escala deve ser definida 
para o construto de segunda ordem também. A modela- 
gem das covariâncias com caminhos de quatro cargas fa- 
toriais poderia tomar três ou quatro graus de liberdade, 
dependendo de como a escala fatorial foi definida. Uma 
estimativa de carga (como y,,, o caminho de EC para 
R&T) pode ser fixada em 1, para definir a escala. Alterna- 
tivamente, todas as quatro estimativas de cargas fatoriais 
podem ser livres se a variância do fator de segunda ordem 
for fixada em 1. 

Modelos de mensuração de ordem superior também 
ainda são sujeitos a padrões de validade de construto. Em 
particular, fatores de segunda ordem devem ser rigorosa- 
mente examinados quanto a validade nomológica, pois é 
possível que várias explicações confusas possam existir 
para um fator de ordem superior. Por exemplo, se todas 
as medidas de itens usam o mesmo tipo de escala de ava- 
liação, poderia haver um fator comum entre métodos in- 
fluenciando todos os construtos de primeira ordem. O fa- 
tor de segunda ordem poderia ser interpretado como um 
viés comum de medição, neste caso. Se o fator de segunda 
ordem reage a outros construtos teóricos como o espera- 
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do, a chance de ele ser deste tipo é menor. Mais especi- 
ficamente, se o fator de ordem superior explica resulta- 
dos teoricamente relacionados, como comprometimento 
organizacional e satisfação com emprego, de forma tão 
eficaz, ou até melhor, do que faz o conjunto combinado 
de fatores de primeira ordem, então há evidência em fa- 
vor da representação de ordem superior [36]. Assim, um 
critério fundamental de validação se torna uma medida 
do quão bem um fator de ordem superior explica teori- 
camente construtos relacionados. Quando se comparam 
modelos de mensuração de ordens distintas, um modelo 
de segunda ordem é sustentado na medida em que ele 
mostra maior validade nomológica do que um modelo de 
primeira ordem. 


Quando usar análise fatorial de ordem superior 
Apesar de modelos de mensuração de ordem superior po- 
derem parecer que têm muitas vantagens, devemos tam- 
bém considerar as desvantagens. Com frequência, eles são 
conceitualmente mais complicados. Um construto pode se 
tornar tão abstrato que é difícil descrever adequadamente 
seu significado. A complexidade adicionada pode também 
diminuir o valor diagnóstico de um construto à medida 
que ele fica mais afastado dos itens medidos tangíveis. 
Modelos CFA de ordem superior criam também mais so- 
luções potenciais CFA impróprias ou não-identificadas. 
Por exemplo, pesquisadores podem ter um ou mais fato- 
res de ordem superior com menos de três indicadores. 

Com um modelo fatorial reflexivo de segunda ordem 
ou de ordem maior, todos os fatores de primeira ordem, 
que agora são indicadores do fator de segunda ordem, de- 
vem se mover juntos, assim como acontece com os itens 
medidos que indicam fatores de primeira ordem. Quan- 
do múltiplos fatores de primeira ordem são usados como 
indicadores de um fator de segunda ordem, o pesquisa- 
dor abre mão da habilidade de testar relações entre esses 
fatores de primeira ordem e outros construtos importan- 
tes. Assim, uma desvantagem do modelo de mensuração 
mostrado na Figura 11-10b é que não podemos investigar, 
por exemplo, relações entre comportamentos de colegas 
e outros resultados importantes de trabalho, como ro- 
tatividade. Além disso, o pressuposto é de que todos os 
quatro indicadores de primeira ordem influenciariam na 
rotatividade da mesma maneira. Se um caso conceitual 
pudesse ser enunciado de maneira que um desses fatores 
de primeira ordem afetaria outro construto importante di- 
ferentemente, então talvez uma teoria de mensuração de 
segunda ordem não devesse ser usada. Este caso é tipifica- 
do quando se esperasse que um conjunto de construtos re- 
lacionados afetasse positivamente algum outro construto 
enquanto outros o afetariam negativamente. 

Algumas questões que podem ajudar a determinar se 
um modelo de mensuração de ordem superior é adequado 
são listadas aqui: 


1. Existe um motivo teórico para esperar que existem camadas 
conceituais de um construto? 


2. Espera-se que todos os fatores de primeira ordem influen- 
ciem outros construtos nomologicamente relacionados da 
mesma maneira? 

3. Os fatores de ordem superior serão usados para prever ou- 
tros construtos do mesmo nível geral de abstração (ou seja, 
personalidade global — atitudes globais)? 

4. As condições mínimas para identificação e prática da boa 
mensuração estão presentes em camadas de primeira ordem 
e de ordem superior da teoria de mensuração? 


Se a resposta a cada uma dessas questões for positiva, 
então um modelo de mensuração de ordem superior se 
torna aplicável. Depois de testar empiricamente modelos 
de ordem superior, as perguntas a seguir devem ser res- 
pondidas. 


1. O modelo fatorial de ordem superior apresenta ajuste ade- 
quado? 

2. Os fatores de ordem superior prevêem adequadamente ou- 
tros construtos conceitualmente relacionados e de forma 
esperada? 

3. Quando se compara com um modelo de ordem menor, o de 
ordem superior exibe validade preditiva igual ou melhor? 


Novamente, se as respostas a tais questões forem todas 
positivas, então uma teoria de ordem superior será supor- 
tada. 


Grupos múltiplos em CFA 


Numerosas aplicações de CFA envolvem a análise de gru- 
pos de respondentes. Grupos são, por vezes, formados a 
partir de uma amostra geral dividindo-a de acordo com 
uma característica lógica significativa como, digamos, uma 
importante diferença individual, como sexo. Por exemplo, 
podemos esperar que homens e mulheres possam não res- 
ponder semelhantemente a uma vasta gama de questões 
de caráter social. Alternativamente, uma grande amostra 
pode ser dividida ao acaso em duas sub-amostras, de for- 
ma que uma validação cruzada possa ocorrer. Mas grupos 
não são sempre separados após o fato. Muitas vezes, di- 
ferentes populações têm amostras coletadas com a meta 
final de testar similaridades e diferenças entre tais popu- 
lações. Por exemplo, as populações podem envolver pes- 
soas de culturas distintas. 

Modelos de grupos múltiplos podem ser acomodados 
em uma estrutura CFA e testados usando-se SEM. Diver- 
sas preocupações extras afetam a validade de modelos de 
múltiplos grupos e os resultados de quaisquer conclusões 
subsequentes referentes aos grupos. Discutimos essas 
questões primeiramente no contexto de validação cruzada 
e então as estendemos para cobrir outras situações. 


Validação cruzada 

Validação cruzada é uma tentativa de reproduzir os resul- 
tados encontrados em uma amostra usando dados de uma 
amostra diferente. Em termos gerais, a validação cruzada 
usa duas amostras obtidas da mesma população. Em ou- 
tras palavras, as unidades de amostragem em cada grupo 
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teriam as mesmas características. Validação cruzada tem 
muitos usos em CFA. Talvez a aplicação mais básica seja 
fornecer uma segunda confirmação de uma teoria de men- 
suração que sobreviveu a um teste inicial. Uma maneira 
de atingir tal objetivo é dividir uma grande amostra ale- 
atoriamente em dois grupos de forma que cada amostra 
atenda às exigências de tamanho mínimo discutidas ante- 
riormente. Uma abordagem CFA de múltiplos grupos nos 
permite entender completamente a extensão em que os 
resultados são os mesmos em ambos os grupos. 

A Figura 11-11 ajuda a ilustrar testes CFA de dois gru- 
pos ou duas amostras. Ela descreve um modelo de men- 
suração de três construtos que se imagina existirem em 
duas amostras ou grupos. Para fins de validação cruzada, 
o grupo 1 pode ser pensado como uma amostra inicial 
usada para testar o modelo CFA de três construtos. Tal- 
vez o teste inicial envolvesse até mesmo um refinamento 
menor, como a eliminação de uma ou duas variáveis não 
mostradas aqui. O grupo 2 pode ser imaginado como uma 
amostra subsegiiente utilizada para fazer validação cruza- 
da com o modelo original. Os parâmetros envolvidos na 
validação cruzada serão as estimativas de carga (X,), as 
correlações entre construtos (b) e a variância associada 
com os termos de erro (chamada de 6,). 

O modelo de mensuração proposto é um arranjo con- 
gênere padrão. Como anteriormente observado, uma 
estimativa de carga para cada fator, ou as variâncias fa- 


Grupo 1 


toriais, seriam fixadas em 1 na estimação do modelo. To- 
dos os demais parâmetros exibidos seriam estimados. O 
modelo resultante teria 51 graus de liberdade. A fórmu- 
la mostrada anteriormente pode ser usada para verificar 
este número. 


Comparação de grupos 

Agora voltamos nossa atenção para vários testes que in- 
dicam o grau em que uma amostra produz os mesmos 
resultados que outra amostra. É importante observar 
que validação cruzada não fornece uma resposta do tipo 
“sim ou não” sobre o quão bem resultados são reprodu- 
zidos em uma amostra independente. Validação cruzada 
é mais uma questão de grau que pode ser determinado 
pela aplicação de uma série de testes progressivamente 
mais rigorosos ao longo de amostras [9, 35]. A lista a se- 
guir inclui testes típicos que vão dos menos para os mais 
rigorosos. 


1. Validação cruzada solta. Com validação cruzada solta, o 
mesmo modelo CFA usado com a amostra original é im- 
posto sobre a amostra de validação. Uma CFA é então con- 
duzida usando somente a amostra de validação. Assim, o 
modelo de CFA mostrado para o grupo 2 na Figura 11-11 é 
testado como se mostra. Se a CFA se ajusta bem aos dados 
do grupo 2, tem-se evidência de validação cruzada. Vale no- 
tar que ambos os modelos terão o mesmo número de graus 
de liberdade, pois a mesma estrutura fatorial é empregada. 


FIGURA 11-11 | Um modelo fatorial de dois grupos padrão. 
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Nenhuma comparação de ajuste é feita entre os grupos 1 e 
2. Ao invés disso, o ajuste deve ser aceitável em ambos os 
grupos separadamente, para se prosseguir com confiança. 
Matrizes equivalentes de covariância. Às vezes, os pesqui- 
sadores conduzem um teste de equivalência para determi- 
nar se os dois grupos apresentam matrizes de covariância 
equivalentes. Teoricamente, este teste é redundante rela- 
tivamente aos testes abaixo, no sentido de que se as duas 
matrizes de covariância forem idênticas, então os resultados 
de CFA também devem ser idênticos. A utilidade e o valor 
diagnóstico deste teste têm sido questionados [37]. Pesqui- 
sadores geralmente prosseguem para os próximos testes, 
não importando o resultado deste. Logo, vamos para os tes- 
tes mais específicos. 

Equivalência de estrutura fatorial. Os testes a seguir envol- 
vem a estimação simultânea de modelos de CFA usando da- 
dos de ambos os grupos. Em terminologia SEM, o número 
de grupos (NG) agora é dois. Logo, matrizes separadas de 
covariância, uma para cada grupo, são computadas como 
um ponto de partida para os próximos testes. Agora, testa- 
mos o mesmo modelo CFA quanto aos dois grupos simulta- 
neamente. Em outras palavras, apenas a estrutura fatorial 
é restrita entre grupos. Este modelo é, às vezes, chamado 
de modelo totalmente livre de múltiplos grupos (TF), pois 
todas as estimativas mostradas (À, P, 6,) são livremente 
estimadas em cada amostra. Os valores, portanto, podem 
ser diferentes entre grupos. O importante valor x e as cor- 
respondentes estatísticas de ajuste agora se referem a quão 
bem o modelo ajusta ambas as matrizes de covariância. Um 
resultado é que os graus de liberdade associados com este 
modelo são o dobro do que ocorre na correspondente CFA 
de um grupo. A Figura 11-11 descreve uma CFA de dois 
grupos que teria 102 graus de liberdade. De fato, poder-se- 
ia juntar ambos os valores x e graus de liberdade dos resul- 
tados individuais de CFA de um grupo, e isso corresponde- 
ria ao resultado de dois grupos. Esta abordagem, algumas 
vezes, é uma maneira útil de verificar erros na especificação 
do modelo de dois grupos. Se os índices resultantes de ajus- 
te para a CFA de dois grupos são adequados, então há pelo 
menos mínima evidência de validação cruzada. Este teste é, 
às vezes, conhecido como invariância de configuração. 
Equivalência de carga fatorial. Este teste restringe as esti- 
mativas de carga a serem iguais em cada grupo. Pense nis- 
so como uma restrição em termos de igualdade que força 
cada estimativa de carga no grupo 2 a ser igual à estimativa 
no grupo 1. Assim, esta restrição poupa tantos graus de li- 
berdade quanto há estimativas de cargas livres no modelo 
original. Outra maneira é pensar na matriz de cargas como 
invariante, o que significa a mesma em cada grupo. Pode- 
se agora examinar a estatística de ajuste do novo modelo 
para avaliar a validade dele. Além disso, pode-se computar 
uma Ay” (variação no qui-quadrado) entre este modelo e o 
modelo TF (a referência). Se Ax for significante, então as 
restrições acrescentadas significativamente pioraram o ajus- 
te. Se não for significante, restringir as estimativas de cargas 
não piora o ajuste, e assim se tem uma maior evidência de 
validação cruzada. 

Equivalência de carga fatorial e de covariância entre fatores. 
Este teste adiciona a restrição de que os termos de cova- 
riância entre fatores descritos nos caminhos curvos de dois 
sentidos (D,,, P,,, D,,) são iguais entre as amostras. Com 


três elementos da matriz de covariância entre fatores agora 
restritos a serem iguais àqueles no outro grupo (como mos- 
trado na Figura 11-11), o modelo usa três graus de liberda- 
de a menos. Como antes, os índices de ajuste geral podem 
ser examinados e uma Axº pode ser calculada entre este e o 
teste anterior. Se o teste não for significante, então as res- 
trições acrescentadas não pioraram o ajuste e temos maior 
evidência de validação cruzada. 

6. Equivalência de carga fatorial, covariância entre fatores e 
variância de erro. Este último teste representa aquilo que 
às vezes é chamado de validação cruzada apertada [35]. Ela 
acrescenta a restrição de que a variância de erro associada 
com cada resíduo é igual entre grupos. Matematicamente, 
as variâncias e covariâncias de erro são representadas em 
forma matricial. As variâncias de erro são encontradas na 
diagonal desta matriz. Tipicamente, os demais elementos 
não são estimados e são fixados em zero. O número de ele- 
mentos de variância de erro se iguala aos itens medidos, pois 
a equação para cada variável medida contém erro. Neste 
caso, o teste deste modelo usaria até 12 graus de liberdade 
a menos, pois os 12 termos de erro no grupo 2 são restritos 
a serem iguais àqueles no grupo 1. Novamente, estatísticas 
de ajuste de modelo e uma Ax” podem ser examinadas. Uma 
Axº insignificante sugere que as restrições acrescentadas não 
pioraram o ajuste e que existe validação cruzada completa 
ou apertada. 


Quanta evidência é necessária para validar um mode- 
lo CFA com uma amostra separada? A validação cruzada 
apertada é considerada ideal, mas talvez mais forte do que 
o necessário [35]. Validação cruzada parcial, como repre- 
sentada por um teste de equivalência de carga fatorial, 
deve fornecer evidência adequada de validação cruzada. 
Além disso, as questões de tamanho de amostra sobre a x 
do modelo se aplicam à estatística Ay”. No entanto, o teste 
de significância é mais útil com os valores de Ax, e, assim, 
essas comparações são muito úteis no estabelecimento do 
grau de validação cruzada. Sob condições com amostras 
muito pequenas ou muito grandes em particular, o pesqui- 
sador pode querer confiar mais em mudanças em índices 
importantes de ajuste relativo, como o CFI ou o PNFI. 


Ilustração de validação cruzada. Ilustraremos testes de 
validação cruzada baseados em resultados que empregam 
duas amostras obtidas de uma população semelhante para 
fazer validação cruzada de um modelo bidimensional de 
mensuração de Auto-Apresentação em Exercício (SPE) 
[19]. A SPE é uma medida psicológica associada com o 
quanto que alguém acredita que exercício contribui para 
a imagem de uma pessoa. As duas dimensões representam 
motivação de impressão (IM) e construção de impressão 
(IC). IM corresponde ao quanto que alguém deseja ser 
percebido como uma pessoa que se exercita, e IC está mais 
preocupada com os benefícios sociais do exercício físico. 
A validação cruzada foi mais apropriada porque modifi- 
cações foram feitas com base nos diagnósticos de resíduos 
padronizados produzidos a partir da CFA inicial. Este pro- 
cesso trunca o modelo de 14 para 9 itens medidos. 


(Continua) 
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(Continuação) 
A Tabela 11-7 resume os resultados de validação cru- 


zada. Cada teste progressivo sustenta validação cruzada. 
O teste de validação cruzada solta (%1) produz estatís- 
ticas adequadas de ajuste. O primeiro teste de amostra 
múltipla (43) também fornece ajuste adequado. Além 
disso, cada teste progressivo produz uma mudança in- 
significante de ajuste sobre o teste subsequente. Assim, 
esses resultados ilustram um caso ideal no qual os resul- 
tados de uma amostra são validados completamente por 
uma amostra subsegiiente. 


Aplicações de CFA de multi-grupos: 

um exemplo cultural 

Muitas pesquisas em negócios e ciências sociais são hoje 
internacionais. Estudos envolvendo amostras obtidas de 
diferentes países são comuns. Pesquisadores estão reco- 
nhecendo cada vez mais as complicações metodológicas e 
conceituais associadas com estudos que envolvem respon- 
dentes de diferentes culturas. Por exemplo, uma simples 
comparação de respostas médias a uma escala de múlti- 
plos itens entre culturas pode não ser válida. Três impor- 
tantes questões devem ser tratadas: 


1. O pesquisador precisa examinar se o significado lingiiístico 
da escala é mantido de uma cultura para outra. Este proces- 
so envolve equivalência de tradução. 

2. O pesquisador deve examinar se as escalas de avaliação em 
si são usadas de forma análoga em diferentes culturas. Tal 
questão envolve invariância métrica. 

3. O pesquisador precisa saber se os significados quantificáveis 
da escala são os mesmos ao longo de culturas, o que envolve 
invariância escalar. 


Equivalência de tradução pode ser estabelecida por 
meio de procedimentos tradicionais de tradução e retra- 
dução e não envolve qualquer procedimento estatístico. 
Este processo resolveria a primeira questão. Procedimen- 
tos de CFA amparam a segunda e a terceira questão, pois 
eles permitem que pesquisadores testem invariância ou 
equivalência métrica e escalar. (Invariância significa va- 
riação nula entre grupos; e equivalência é outra forma de 
expressar a mesma idéia. Os dois termos podem ser usa- 
dos alternadamente.) Cada uma dessas características é 
descrita nas próximas seções. 


TABELA 11-7 Estatísticas de validação cruzada para a escala de SPE 


Equivalência métrica. Uma condição de teoria de men- 
suração na qual as medidas que formam um modelo de 
mensuração têm o mesmo significado e são usadas do 
mesmo modo por diferentes grupos de respondentes é 
chamada de invariância métrica [18]. Como uma medida 
de invariância de medida, cla fornece ao pesquisador uma 
indicação se pessoas de diferentes culturas interpretam e 
usam as escalas da mesma maneira. Invariância métrica 
fornece evidência de que respondentes usam escalas de 
avaliação de maneira semelhante ao longo de grupos, 
no sentido de que as diferenças entre valores podem ser 
comparadas. Em outras palavras, respondentes usam os 
intervalos entre valores de construtos da mesma manei- 
ra em cada grupo. Ainda que esta idéia possa ser difícil 
de assimilar conceitualmente, o resultado simples é que 
invariância métrica permite comparações com significado 
sobre a força de relações entre construtos de um grupo 
com o outro. Invariância métrica não pode existir sem in- 
variância de configuração (condição nº 3 na lista da seção 
sobre comparação de grupos). Invariância métrica com- 
pleta também demanda que as cargas fatoriais sejam inva- 
riantes entre os grupos que serão comparados. Assim, ela 
requer equivalência de cargas fatoriais (condição nº 4 na 
lista de comparação de grupos) [18]. 

Um novo exame da Figura 11-11 mostra que haveria 
invariância métrica completa quando restrições ao mode- 
lo para ter estimativas iguais de carga não diminuíssem 
significativamente o ajuste. Logo, poderíamos significa- 
tivamente comparar relações entre os construtos em um 
grupo com a relação entre os construtos no segundo gru- 
po. Analogamente, teríamos comparações válidas sobre 
todas as relações entre construtos. Invariância métrica 
completa é um teste rigoroso na maioria dos contextos. 

Na prática, invariância métrica parcial é considerada su- 
ficiente para viabilizar comparações de relações entre gru- 
pos. O nível de invariância parcial necessário requer que 
pelo menos duas estimativas de carga para cada construto 
sejam iguais entre grupos. CFA pode fornecer um teste de 
invariância parcial pela comparação do modelo de refe- 
rência TF (totalmente livre) com um modelo restringindo 
uma estimativa de carga para ser igual entre grupos. Assim, 
por exemplo, poderia ser acrescentada uma restrição que 
demandasse que a estimativa de carga À,,, fosse a mesma 
em ambos os grupos, 1 e 2. Uma Ax” pode ser usada para 


Descrição do modelo df CFI RMSEA Comentários 
1. Validação cruzada solta 26 81,3 0,96 0,08 Ajuste razoavelmente bom 
3. Equivalência de estrutura fatorial 52 176,6 0,95 0,08 Ajuste razoavelmente bom 
4. Equivalência de carga fatorial 59 184,5 0,95 0,08 Ax? = 7,9, insignificante 
5. Equivalência de covariância entre fatores 62 185,6 0,95 0,08 Axa = 1,1, insignificante 
6. Equivalência de variância de erro 71 197,5 0,95 0,07 Axo = 11,9, insignificante 


Fonte: Adaptada de Conroy e Motl, 2003. “Modification, Cross-Validation, Invariance, and Latent Mean Structure of the Self-Presentation in Exercise Questionnaire; 


Measurement in Physical Education and Exercise Science 7 (1): 1-18. 


” 
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ver se a restrição adicionada diminui significativamente o 
ajuste. Este processo pode ser repetido em um esforço para 
determinar se dois itens invariantes por fator podem ser 
encontrados. Com três construtos, um mínimo de seis es- 
timativas de cargas (duas em cada um dos três construtos) 
seria necessário para ser invariante entre os grupos 1 e 2. 
Se seis pudessem ser encontradas por este processo, uma 
CFA final seria conduzida acrescentando-se todas as seis 
restrições de igualdade ao modelo TF. Os ajustes são com- 
parados como antes com uma estatística Ay” insignificante 
e/ou melhores valores de PNFI para o modelo mais restrito 
sustentando invariância métrica parcial [24, 48]. 


Invariância escalar. Estudos de cruzamentos culturais 
frequentemente envolvem a comparação de construtos 
entre culturas. Especificamente, comparamos as médias 
entre duas populações. Na Figura 11-11, os dois grupos 
poderiam ser dois países diferentes, talvez Rússia e Es- 
tados Unidos, e gostaríamos de perceber se os construtos 
são maiores na Rússia do que nos Estados Unidos. Se este 
exemplo é apropriado para a HBAT, a administração da 
HBAT pode querer examinar uma questão de pesquisa 
na qual se indaga se três medidas latentes — qualidade, sa- 
tisfação e lealdade — exibem médias mais elevadas nos Es- 
tados Unidos ou na Rússia. Outros pesquisadores podem 
querer comparar satisfação com emprego, auto-estima ou 
até mesmo inteligência entre populações. 

À primeira vista, esta comparação parece uma questão 
simples. MANOVA poderia ser usada para testar diferen- 
ças de médias. Isso seria apropriado quando as variáveis 
dependentes ou os construtos fossem relacionados entre si 
e a variável independente chave fosse não-métrica. Neste 
caso, ela seria uma variável dicotômica representando o 
país de um respondente. Técnicas de ANOVA poderiam 
ser empregadas sobre variáveis ou construtos dependen- 
tes que não são relacionados entre si. Seriam aplicadas se- 
paradamente para cada variável ou construto dependente. 
MANOVA e ANOVA tradicionais continuam sendo as 
ferramentas estatísticas mais comumente aplicadas para 
teste de diferenças entre culturas de grupos. Resultados 
a partir dessas abordagens são precisos somente quando 
as três questões sobre invariância de medição cruzada de 
culturas são confirmadas. 

Aparecem diferenças nas médias entre dados de duas 
populações diferentes (países, neste caso)? Esta questão 
aparentemente simples se torna complexa sempre que 
nos preocupamos com problemas como saber se quantias 
de um construto (neste caso, médias) sob consideração 
têm o mesmo significado em ambas as populações. Um 
teste de equivalência escalar pode fornecer esta evidên- 
cia. Equivalência escalar significa que quantias têm o 
mesmo significado entre os dois grupos considerados. Em 
outros termos, um escore de satisfação com emprego de 
15 em uma cultura seria expresso como um 15 em outra. 
Mais especificamente, equivalência escalar é estabelecida 
examinando-se se os pontos-zero (o valor das variáveis 


observadas quando um construto é igual a zero) são os 
mesmos entre grupos. Quando as equivalências métrica e 
escalar são ambas estabelecidas, diz-se existir forte inva- 
riância fatorial juntamente com a correspondente habili- 
dade de comparar relações e médias entre eles [18]. 

Você pode lembrar que em nossa discussão sobre 
análise de regressão (Capítulo 4), o termo de intercep- 
to na equação de regressão (b,) frequentemente não era 
de interesse na interpretação de relações entre variáveis. 
Analogamente, nossa discussão de SEM evitou qualquer 
menção sobre um intercepto ou um termo de intercepto- 
zero, pois isso não é importante para entender como itens 
medidos são relacionados com construtos dentro de um só 
grupo. Mas não podemos evitar isso agora. Na verdade, o 
intercepto deve ser examinado quando se testa equivalên- 
cia escalar. Existe equivalência escalar quando os termos 
de intercepto para cada variável medida são invariantes 
entre os grupos sob estudo. 

Invariância escalar completa existe quando o vetor de 
termos de intercepto-zero em um grupo não é significati- 
vamente diferente dos vetores nos demais grupos em estu- 
do. Em outras palavras, isso resulta quando todos os ter- 
mos intercepto são invariantes entre grupos. Invariância 
escalar parcial pode ser suficiente para permitir compara- 
ções médias entre grupos. Se dois termos de intercepto de 
item sobre cada construto são iguais entre grupos, então 
comparações de média são consideradas válidas [48]. 

A CFA testa invariância escalar completa ou parcial. O 
procedimento também envolve a comparação de ajuste de 
um modelo com as restrições adicionadas associadas com 
invariância escalar a um modelo de referência menos res- 
trito. O modelo de referência neste caso é aquele associado 
com invariância métrica (completa ou parcial, conforme o 
caso). Note que ambas as invariâncias, métrica e escalar, 
são necessárias para fazer comparações válidas. No caso 
de invariância escalar completa, o ajuste CFA de um mo- 
delo, adicionando a restrição de que o vetor é o mesmo em 
cada grupo, não é significativamente pior do que o ajuste 
do modelo de referência. Se invariância escalar completa 
não pode ser estabelecida, então o teste para invariância 
escalar parcial envolveria restrições que igualam dois ter- 
mos de intercepto por construto entre grupos. Novamente, 
se este modelo se ajusta tão bem quanto o modelo de refe- 
rência, então variância* escalar parcial é estabelecida. 


Visão geral de teste de invariância. A crescente presen- 
ça de pesquisa sobre cruzamento de nações tem gerado 
considerável interesse em procedimentos que avaliam in- 
variância métrica. Mais notavelmente, surgem questões 
sobre o quão bem índices tradicionais de ajuste, incluin- 
do a estatística Ax”, se aplicam para estabelecer invariân- 
cia de medida. Estudos de simulação demonstram que 
testes convencionais envolvendo vários níveis de restri- 
ções fazem um bom trabalho de diagnóstico de invariân- 
cia ou de sua falta na maioria das condições. Ou seja, 


* N. de R.T.: O termo correto seria “invariância”. 
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os testes funcionam bem desde que as amostras sejam 
grandes o bastante e cada construto inclua um número 
suficiente de itens [37]. A Tabela 11-8 resume os níveis 
de invariância de medida associados com comparações 
entre populações. 


Teste de diferenças em médias de construtos 

Um último tipo de comparação multi-grupos é o teste para 
diferenças em médias de construtos. Se há pelo menos 
invariância escalar parcial, podemos operacionalizar um 
valor para as médias dos construtos latentes. Deste modo, 
dizemos ao programa SEM que estamos interessados na 
análise de médias. O Apêndice 11B mostra a equação que 
é introduzida para representar médias de construtos la- 
tentes. Porém, de uma maneira ou de outra, o programa 
SEM deve ser avisado que estamos interessados nas mé- 
dias de tais construtos. 

Programas SEM comparam médias apenas em um 
sentido relativo. Em outros termos, eles podem dizer a 
você se a média é maior ou menor relativamente a outro 
grupo [39]. Uma razão para tal limitação tem a ver com 
identificação, uma vez que os termos de intercepto estão 
agora sendo estimados. Um resultado é que o vetor de 
médias de construtos latentes (contido na matriz kapa) 
tem que ser fixado em zero em um grupo, para identificar 
o modelo. Chamamos este grupo de grupo 1. Ele pode ser 
livremente estimado nos demais grupos e os valores resul- 
tantes podem ser interpretados como quão acima ou abai- 
xo as médias de construtos latentes estão nestes grupos, 
relativamente ao grupo 1. 


Usando o exemplo ilustrativo da Figura 11-11, a saída 
SEM incluirá agora estimativas para o vetor no grupo 2. 
Tipicamente, esta saída incluiria um valor estimado, um 


erro padrão e um valor-t associado com cada valor. Por 
exemplo, pode se parecer com isto: 


KAPA (K) 
Construto 1 Construto 2 Construto 3 
26 0,09 3,50 
(0,45) (0,60) (1,55) 
5,18 0,10 —2,25 


Esses valores sugerem que a média para o construto 1 
é 2,6 maior no grupo 2 do que no grupo 1. Esta diferença 
é significante, como se evidencia pelo valor-t de 5,78 (p 
< 0,001). A média para o construto 2, diferindo por 0,09, 
não é significativamente distinta (t = 0,10). A média para 
o construto 3, por outro lado, é significativamente menor 
no grupo 2 relativamente ao grupo 1 (t=-2,25:p < 0,05). 
Esses tipos de comparação de valores médios de constru- 
tos podem ser úteis na pesquisa de culturas [24, 48]. 


Parcelamento de item em CFA e SEM 


Parcelamento de item se refere à combinação de variáveis 
medidas em conjuntos de diversas variáveis por soma ou 
cálculo de média de itens. O parcelamento oferece uma 
maneira de lidar com um número não-gerenciável de va- 
riáveis reflexivas medidas por construto [17]. Por exem- 
plo, algumas escalas psicológicas podem conter mais de 
100 itens para capturar apenas duas ou três dimensões 
básicas de personalidade. Assim, mesmo com uns poucos 
construtos pode-se terminar com muito mais do que 100 
itens medidos. Aplicações de SEM são difíceis de geren- 
ciar com tantas variáveis medidas. 

Usando-se parcelamento de itens, um único construto 
latente com 40 itens medidos (x, — x,o) poderia ser repre- 
sentado por oito parcelas, cada uma consistindo de 5 dos 
40 itens medidos. Uma parcela é uma combinação mate- 
mática que resume múltiplas variáveis em uma. No caso 
extremo, todos os itens medidos para um construto podem 


TABELA 11-8 Resultados de testes de invariância de medidas em comparações de populações 


Tipo de invariância Restrição 


Compara ajuste com: 


Resultado para comparações de grupos 


Invariância métrica completa Todas as estimativas de cargas Modelo CFA Comparações de relações entre construtos 
iguais ao longo de todos os grupos. multi-grupo TF são válidas. 

Invariância métrica parcial Ao menos duas estimativas de Modelo CFA Comparações de relações entre construtos 
carga fatorial iguais em todos os multi-grupo TF são válidas. 


grupos. 
Todas as estimativas de intercepto 
zero de item medido são iguais em 
todos os grupos. 


Pelo menos dois termos de inter- 


Invariância escalar completa 


Invariância escalar parcial 


Modelo de invariância 
métrica 


Modelo de invariância 


Comparações de relações entre construtos 
e comparações entre médias de construtos 
são válidas. 


Comparações de relações entre construtos 


cepto zero de item são iguais ao métrica e comparações entre médias de construtos 
longo de todos os grupos. são válidas. 
Invariância fatorial forte Exigências de invariância escalar Modelo CFA Comparações de relações entre construtos 


completa e invariância métrica 
completa. 


multi-grupo TF 


e comparações entre médias de construtos 
são válidas. 
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ser combinados em uma média ou uma soma daquelas va- 
riáveis. No Capítulo 3, discutimos como criar um constru- 
to somado dessa maneira. O termo indicador composto 
é geralmente usado para se referir a parcelamento que 
resulta em apenas uma parcela de todos os itens medidos 
para um construto. 

Numerosas questões estão associadas com parce- 
lamento de itens. Essas questões incluem a adequação 
do parcelamento, quais itens devem ser combinados 
em uma parcela, e quais são os efeitos do parcelamento 
sobre a avaliação de modelos. Parcelamento tem o po- 
tencial para melhorar o ajuste do modelo simplesmente 
por reduzir a complexidade do modelo, e modelos com 
menos variáveis têm potencial para melhor ajuste [31]. 
No entanto, melhora somente no ajuste não é argumen- 
to o suficiente para se combinar múltiplos itens em um, 
pois o principal objetivo é a criação de um modelo que 
melhor represente os dados reais. Além disso, parcelas 
de item podem frequentemente mascarar problemas 
com medidas de itens e sugerir um ajuste melhor do que 
realmente existe [7]. Parcelamento pode também ocultar 
outros construtos latentes que existem nos dados. Assim, 
uma matriz de covariância que realmente contenha cinco 
construtos latentes pode ser adequada, mas falsamente 
representada por três construtos latentes usando-se par- 
celamento. 


Quando é apropriado o parcelamento? 
Parcelamento de itens deve ser considerado somente 
quando um construto tem um grande número de indica- 
dores de variáveis medidas. Por exemplo, aplicações en- 
volvendo menos de 15 itens não requerem parcelamento. 
Analogamente, parcelamento não é empregado com mo- 
delos formativos, pois é importante que todas as causas 
de um fator formativo sejam incluídas. Parcelamento é 
adequado quando todos os itens para um construto são 
unidimensionais. Ou seja, mesmo com um grande número 
de itens medidos, todos eles deveriam carregar altamente 
sobre apenas um construto e deveriam mostrar alta con- 
fiabilidade (0,9 ou mais). Mais importante, parcelamento 
é apropriado quando não se perde informação no uso de 
parcelas no lugar de itens individuais [30]. Assim, algumas 
verificações simples anteriores ao parcelamento envolvem 
a execução de uma CFA sobre o fator individual, para ve- 
rificar unidimensionalidade e para ver se o construto refle- 
tido por todos os itens individuais se relaciona com outros 
construtos da mesma maneira que um construto refletido 
por um número menor de parcelas. 


Como itens devem ser combinados em parcelas? 

Tradicionalmente, pouco se tem pensado na maneira 
como itens devem ser combinados. Contudo, a estratégia 
de combinação pode afetar a possibilidade de que uma 
CFA esteja na verdade sustentando uma falsa teoria de 
mensuração. Apesar de muitas complicações serem asso- 
ciadas com as estratégias de combinação, duas conside- 


rações simples levam ao melhor desempenho quando um 
pesquisador deve usar parcelamento. Uma consideração é 
empírica e a outra, teórica. Sabendo-se que os itens indivi- 
duais sugerem unidimensionalidade, as melhores parcelas 
são formadas por itens que retratam aproximadamente 
a mesma covariância, o que deve levá-los a terem apro- 
ximadamente as mesmas estimativas de cargas fatoriais. 
Além disso, as parcelas devem conter grupos de itens com 
a maior similaridade conceitual. Isto é, itens com a vali- 
dade de conteúdo mais próxima. Portanto, parcelas com 
itens que mostram aproximadamente a mesma covariân- 
cia e que compartilham uma base conceitual tendem a ter 
um bom desempenho e a representar os dados com me- 
lhor precisão [30]. 


ILUSTRAÇÕES DE CFA AVANÇADA 


Esta seção fornece ilustrações de CFA avançada. Estão in- 
cluídas aplicações do conjunto de dados de HBAT SEM 
para análises de grupos múltiplos e viés de medidas. 


Análises de grupos múltiplos 


Durante as entrevistas entre a administração da HBAT 
e os consultores, surgiram numerosas questões sugerindo 
uma necessidade de comparar empregados homens com 
mulheres. 


Da mesma maneira que invariância seria testada se duas 
amostras internacionais fossem usadas, ou se os dados 
fossem divididos em amostras de validação e de valida- 
ção cruzada, testes de invariância são necessários para 
comparar os resultados de CFA obtidos a partir de em- 
pregados do sexo masculino e feminino. 

Muito semelhante com a divisão de amostra usando 
SPSS em outros procedimentos multivariados, os dados 
gerais podem ser separados em dois grupos: um para res- 
pondentes homens e outro para respondentes mulheres. 
Neste estudo, 200 empregados do sexo masculino e 200 
empregados do sexo feminino responderam o questioná- 
rio. O usuário deve informar ao programa SEM que uma 
análise de múltiplos grupos está sendo conduzida. Con- 
sulte a documentação de seu programa para ver como 
esta informação é transmitida com seu software SEM 
preferido. Essencialmente, o modelo é reproduzido em 
todas as amostras consideradas e o ajuste é determinado 
agora pela qualidade do modo como o modelo reproduz 
todas as matrizes de covariância de amostra observada. 
Assim, somente um valor x” é fornecido. 


Passos em invariância de medida 

Nesta seção, demonstramos os testes necessários associa- 
dos com validação cruzada e invariância de medida. Esses 
procedimentos se sobrepõem, mas podem ser separados 
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em cinco passos, com cada passo ficando mais restrito. Os 
procedimentos usados aqui são os mesmos utilizados em 
qualquer validação cruzada de CFA. Analogamente, os 
procedimentos se estendem a testes de invariância entre 
amostras obtidas de diferentes países. 


A meta é examinar se os resultados da amostra de em- 
pregados homens podem passar por validação cruzada 
usando a amostra de empregados do sexo feminino. 
De um ponto de vista de medição, frequentemente es- 
taríamos validando usando uma amostra com o mesmo 
perfil demográfico obtido da mesma população, o que 
corresponderia ao exemplo SPE ilustrado na Tabela 
117. 


Validação cruzada solta. O primeiro passo é validação cru- 
zada solta estabelecida pela aplicação separada de CFA ao 
mesmo modelo de mensuração em cada amostra. Assim, dois 
modelos CFA são testados neste exemplo de dois grupos. 
Se mais de dois grupos estão envolvidos, então mais CFAs 
são exigidas. Aqui, examinamos o grau em que resultados da 
amostra de homens pode passar por validação cruzada com 
os resultados da amostra de mulheres. 


As CFAs são realizadas mediante a mesma estrutura de 
medição usada com a amostra geral (Figura 11-8). Pro- 
cessando o programa SEM duas vezes, uma vez com os 
dados de homens e uma vez com os dados de mulheres, 
obtemos resultados CFA para homens e mulheres, res- 
pectivamente. As estatísticas resultantes de ajuste da 
HBAT a partir de cada teste são as seguintes: 


Homens Mulheres 
X 206,7 2221 
df 179 179 
p 0,076 0,016 
RMSEA 0,021 0,028 
Cri 0,99 0,99 


Os valores de RMSEA e CFI são muito parecidos 
para cada grupo e sugerem um bom ajuste para as 
amostras de homens e mulheres. Usando uma taxa de 
erro Tipo I de 0,01, os homens têm um teste x” pratica- 
mente insignificante (p = 0,076), e o mesmo ocorre com 
a amostra de mulheres (p = 0,016). Nenhum problema 
significante foi observado com validade de construto 
em qualquer amostra. Portanto, os critérios de valida- 
ção cruzada solta são atendidos, pois o modelo de men- 
suração parece válido em ambas as amostras tomadas 
separadamente. 


Equivalência de estrutura fatorial. Análises de múltiplos 
grupos começam com este passo. O teste de equivalência 


de estrutura fatorial examina o modelo de mensuração 
original em ambas as amostras, como na validação cruza- 
da solta, mas agora o modelo será estimado em cada gru- 
po simultaneamente, e não em separado. Esses índices de 
ajuste agora se referem à precisão com que o modelo de 
mensuração reproduz a matriz de covariância observada 
para homens e mulheres. 


No lugar de estatísticas separadas de ajuste para as 
amostras de homens e mulheres, um conjunto-chave de 
estatísticas de ajuste é fornecido. Como resultado, olha- 
mos um conjunto de índices de ajuste ao invés de dois. 
Lembre-se que os parâmetros livres associados com o 
modelo de mensuração da HBAT não estão restritos 
entre grupos; logo, este modelo é dito TF (totalmente 
livre). As correspondentes estimativas de parâmetros 
frequentemente assumem diferentes valores em cada 
amostra, como brevemente veremos. 

Como esperado, o x” do modelo para a CFA de dois 
grupos (homens versus mulheres) se iguala ao valor ob- 
tido pela adição dos dois valores x do processo de vali- 
dação solta. Tal valor é 428,8 com 358 graus de liberdade 
(p = 0,006). A RMSEA para o modelo de dois grupos é 
0,025, com um intervalo de confiança de 90% de 0,000 
a 0,037. O CFI é de 0,99. Esses resultados suportam o 
modelo de mensuração. Assim, a mesma estrutura fato- 
rial é apropriada em qualquer amostra. Equivalência de 
estrutura fatorial é sustentada. 

A Figura 11-12 exibe as estimativas resultantes de 
parâmetros em cada grupo usando um diagrama visual. 
Um propósito de apresentar este diagrama é demonstrar 
como se parece o resultado quando se baseia em um dia- 
grama de caminhos. Esse método de apresentação pa- 
drão para estimativas de parâmetros está disponível em 
AMOS ou LISREL, quando um diagrama de caminhos 
é requisitado. Alguns usuários preferem a saída visual, e 
outros podem preferir em forma de texto. No entanto, à 
medida que os modelos aumentam em complexidade, os 
diagramas ficam cada vez mais difíceis de ler. 

As estimativas de parâmetros no diagrama geral- 
mente sustentam o modelo TF. Não as discutimos em 
detalhes porque elas seguem de maneira muito próxima 
aquelas apresentadas para a amostra geral em termos da 
adequação de cargas fatoriais, variância extraída e es- 
timativas de confiabilidade. Portanto, a HBAT conclui 
que o modelo de mensuração proposto tem suficiente 
validade em ambos os grupos. Ele também satisfaz os 
critérios para validação estrutural fatorial. 


Equivalência de carga fatorial. O próximo teste restringe 
o modelo de CFA de uma maneira que requer que as es- 
timativas de cargas fatoriais nos dois grupos sejam iguais. 
Equivalência de carga fatorial é testada examinando-se 
os efeitos do acréscimo dessa restrição sobre o ajuste do 
modelo TF. 
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FIGURA 11-12 Resultados de CFA de dois grupos de empregados da HBAT. 


Nota: A primeira estimativa mostrada é o resultado para o grupo de homens, e a segunda é o resultado para o grupo feminino (homens/mulheres). 


Números exibidos são estimativas completamente padronizadas. 


A Tabela 11-9 retrata as estatísticas de ajuste associadas 
com ambos os modelos, obrigando as estimativas de car- 
gas fatoriais na amostra de homens a serem iguais âquelas 
da amostra feminina. Ela contém também resultados para 
outros modelos que testam demais graus de equivalência. 
A estatística de ajuste de x para o modelo de equivalên- 
cia de carga fatorial é de 486,0 com 374 graus de liberda- 
de. Subtraindo os resultados de TF a partir disso, obte- 
mos o valor Ay” de 57,2 com 16 graus de liberdade. Com 
base em 16 estimativas de carga fatorial, o valor crítico da 
distribuição x com 16 graus de liberdade é de 32,0 com 
um risco de erro do Tipo I de 0,01. Portanto, as restrições 
adicionadas pioram significativamente a estatística xy. A 
RMSEA aumenta para 0,032, enquanto a CFI cai para 
0,98. A PNFI aumenta ligeiramente para 0,83, refletindo 
a maneira como recompensa modelos com complexidade 
menor — o que significa menos parâmetros livres. Apesar 
de poder ser argumentado que o PNFI aumentado susten- 
ta equivalência, a HBAT assume uma abordagem mais 
conservadora com base na magnitude relativa do valor 
Ax”. Não é incomum que o PNFI entre em conflito com 
outros indicadores. Dado o debate sobre o uso do PNFI 


e o fato de que a melhora é pequena (0,03), maior con- 
fiança vem de se basear nos demais resultados. Assim, a 
conclusão é que o modelo carece de equivalência de carga 
fatorial e que validação cruzada das amostras se estende 
somente para estruturas fatoriais equivalentes. 


Equivalência de covariância entre fatores. Se equivalên- 
cia de carga fatorial é sustentada, então o próximo passo 
é o exame de equivalência de covariância entre fatores. 
Como descrito anteriormente, este processo exige a adi- 
ção de outra restrição para o processo de estimação. 


Como nossos resultados não sustentam equivalência de 
carga fatorial, este passo não seria necessário para exami- 
nar validação cruzada simples. No entanto, pode ser ne- 
cessário por alguma outra razão, trazendo atenção especial 
às correlações entre fatores. Também o apresentamos aqui 
para ilustrar como ele é executado e sua interpretação. 

O modelo pode ser estimado adicionando-se a res- 
trição de que a matriz de covariância entre fatores de 
um grupo é equivalente à matriz de covariância do outro 


(Continua) 
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(Continuação) 
grupo. Se elas não são verdadeiramente iguais, o ajuste 


deve piorar por conta desta restrição. Neste caso, a res- 
trição adicionada piora significativamente o ajuste (Ax 
= 53,9, df= 15, p < 0,001). Novamente, um pequeno au- 
mento (0,03) no PNFI é observado em comparação com 
o modelo anterior. No entanto, o significante AY e o au- 
mento em RMSEA sugerem uma falta de equivalência 
de covariância entre fatores. 


Equivalência de variância de erro. A seguir, ilustramos 
como examinar a equivalência de variância de erro entre 
amostras. Como o outro teste, precisamos adicionar uma 
restrição ao modelo. Neste caso, as estimativas de variân- 
cia de erro devem ser restritas para serem iguais em cada 
amostra. 


Como ocorre com a restrição de covariância entre fa- 
tores já discutida, este vínculo também piora significa- 
tivamente o ajuste (Ax” = 134,2, df = 21, p < 0,001). O 
CFI cai para 0,96 e a RMSEA sobe para 0,051*. Assim, 
a conclusão é que os termos de variância de erro não são 
equivalentes nas amostras de homens e mulheres. 


Invariância métrica 

Invariância métrica completa não pode ser sustentada, a 
menos que equivalência de carga fatorial também seja sus- 
tentada, pois ela sugere que as cargas variam significativa- 
mente de um grupo para o seguinte. Contudo, pesquisado- 
res podem estar interessados na comparação de relações, 
que pode ser executada se invariância métrica parcial puder 
ser estabelecida. Lembre-se que invariância métrica parcial 
existe quando pelo menos dois itens que carregam sobre 
cada fator são equivalentes de um grupo para o próximo. 
Portanto, uma série de modelos de CFA que restringem su- 
cessivamente apenas duas estimativas de cargas sobre um 
fator pode ser usada para testar invariância métrica parcial. 


Ainda que invariância métrica completa não possa ser 
sustentada por conta da falta de equivalência de car- 
ga fatorial, a HBAT está interessada na comparação 


* N. de R.T.: Este número (0,051) é ligeiramente diferente na Tabela 
11-9 (0,05). 


de relações. Como resultado, testes posteriores foram 
conduzidos para ver se invariância métrica parcial po- 
deria ser estabelecida. Se começamos a partir do mo- 
delo TF, podemos acrescentar uma restrição de que 
qualquer parâmetro individual seja o mesmo entre 
grupos, selecionando qualquer estimativa de carga li- 
vre do grupo 1 e restringindo-a a ser igual ao mesmo 
valor no grupo 2. 

Por exemplo, as estimativas para À, € À,sj Serão res- 
tritas a serem iguais em cada grupo. Podemos então exami- 
nar o quanto de mudança este vínculo provoca no ajuste. 
Os resultados sugerem que o ajuste não se modifica sig- 
nificativamente. O X do modelo é igual a 431,35 com 360 
graus de liberdade. A RMSEA é 0,024, o CFI é 0,99, e o 
PNFI é de 0,81. Subtraindo os resultados de TF, descobri- 
mos que Ax = 2,55 com 2 df. O valor x crítico para 2 df é 
9,21 (erro Tipo I = 0,01). Logo, essas duas estimativas de 
caminhos mostram equivalência ao longo dos grupos. 

Este processo pode ser continuado para cada um 
dos demais fatores. Depois de fazer isso, o consultor da 
HBAT descobre que as seguintes estimativas de cargas 
dos parâmetros (valores lambda) são equivalentes entre 
amostras: 


Parâmetro Construto Variável medida 
Ao JS a 
Asa JS X 
Ago OC Xg 
Àvg2 OC X 
Aus SI Xg 
Àas3 SI Xy 
Aas4 EP X 
Aus EP Xro 
À9s AC X1g 
Avis AC Xyo 


Se pelo menos dois itens por fator podem ser res- 
tringidos a serem iguais sem significativamente piorar o 
ajuste, invariância métrica parcial é sustentada. Como 
resultado, podem ser feitas comparações válidas das re- 
lações entre construtos envolvendo as amostras de ho- 
mens e de mulheres. Retornamos a este ponto com mais 
detalhes no Capítulo 12. 


TABELA 11-9 Resultados de testes de invariância de mensuração para homens e mulheres 


a 


X df p RMSEA CFI PNFI AX Adf p 

Grupos individuais: 

Homens 206,7 179 0,078 0,021 0,99 0,81 

Mulheres 222,1 179 0,016 0,028 0,99 0,8 
TF (Equivalência de estrutura fatorial) 428,8 358 0,006 0,021 0,99 0,81 
Equivalência de carga fatorial 486,0 374 0,0002 0,032 0,98 0,83 57,2 16 p<0,001 
Equivalência de covariância fatorial 539,9 389 0,0000 0,038 0,98 0,86 53,9 15 p< 0,001 
Equivalência de variância de erro 674,1 410 0,0000 0,05 0,96 0,89 134,2 21 p< 0,001 


CAPÍTULO 11 SEM: Análise Fatorial Confirmatória 633 


Equivalência escalar 

Descrevemos anteriormente neste capítulo como inva- 
riância escalar é sustentada quando termos de intercep- 
to correspondentes para as variáveis observadas são os 
mesmos em cada grupo. Este teste complica as coisas, no 
sentido de que os interceptos zero da variável medida têm 
que ser parametrizados (isto é, explicados em computa- 
ções e/ou estimados) dentro da CFA. Além disso, as mé- 
dias da variável latente também são parametrizadas via 
kapa. O leitor pode consultar a documentação do respec- 
tivo programa SEM quanto a detalhes sobre as maneiras 
como esses passos podem ser levados a cabo. 


A HBAT está interessada em diferenças entre empre- 
gados homens e mulheres. Antes que comparações váli- 
das em médias possam ser feitas, temos que saber que as 
duas populações interpretam os significados e valores da 
escala do mesmo modo. Portanto, a HBAT aplicará um 
teste de invariância escalar. Eles estão particularmente 
interessados em comparar compromisso organizacional 
e percepções de ambiente para ambos os grupos. Assim, 
neste momento eles escolhem a simplificação da CFA 
para incluir somente esses dois construtos. 

Neste caso, devemos estabelecer invariância escalar 
antes que as médias de grupos para comprometimento 
organizacional e percepção de ambiente possam ser 
comparadas. Depois de parametrizar os interceptos 
zero da variável medida (TX) e restringir para que 
os termos intercepto de um grupo sejam iguais (TX = 
IN) aos correspondentes termos intercepto do outro 
grupo, as seguintes estatísticas de ajuste foram produ- 
zidas: 


Grupo 2 Restrição: 

TX=FR TX = IN 
X 165,6 174,4 
df 44 52 


Neste caso estamos preocupados com a diferença 
de ajuste e não com o ajuste geral, uma vez que a va- 
lidade de construto já foi estabelecida na CFA sem os 
interceptos zero ou médias de construto latente. Assim, 
Axº se torna especialmente importante. Neste caso, Ax'= 
8,9* com 8 graus de liberdade, o que não é significan- 
te. Portanto, a restrição acrescentada de que os termos 
intercepto da variável medida são iguais ao longo dos 
grupos não prejudica significativamente o ajuste. Desse 
modo, invariância escalar completa é estabelecida e a 
HBAT pode promover comparações válidas de médias 
de construto latente. Se não fosse o caso, o analista da 
HBAT poderia ter testado equivalência individual de 
interceptos de variável medida, dois por vez, como um 
esforço para estabelecer invariância escalar parcial. Esta 


abordagem seria consistente com o método usado pre- 
viamente para estabelecer invariância métrica parcial. 

Porém, estamos mais interessados nos valores para as 
médias de construto latente (rotulados aqui por KAPA). 
Os valores a seguir estão dispostos na primeira seção de 
saída associada com os resultados para homens: 


KAPA (Kk) 

oc EP 
0,29 0,55 
(0,44) (0,22) 
0,66 2,48 


Somente um conjunto de médias é fornecido, pois 
elas representam a diferença entre médias de grupos. 
SEM não produzirá médias para cada grupo. A média 
padronizada para comprometimento organizacional na 
amostra de homens é estimada em 0,29, com um erro 
padrão de 0,44 e um valor-t de 0,66. Este valor deve 
ser interpretado como uma comparação de médias pa- 
dronizadas. Em outras palavras, é uma interpretação 
relativa que indica que comprometimento organiza- 
cional é 0,29 maior entre empregados homens do que 
entre as mulheres. Esta diferença não é significante. A 
percepção ambiental média padronizada na amostra de 
homens é estimada em 0,55, com um erro padrão de 
0,22 e um valor-t de 2,48. Este resultado é significante 
(p < 0,05). Assim, percepção do ambiente é 0,55 mais 
favorável entre empregados do sexo masculino do que 
entre empregados do sexo feminino. A HBAT conclui, 
portanto, que homens gostam mais do ambiente de tra- 
balho do que mulheres, apesar de ambos os grupos se- 
rem igualmente comprometidos. 


*N. do R. T. O valor correto seria 8,8. 


Resumo 

Esta seção introduziu vários testes de equivalência con- 
duzidos no âmbito de CFA básica de grupos múltiplos. A 
despeito de o modelo CFA de dois grupos TF ser uma ex- 
tensão razoavelmente direta da abordagem padrão de um 
grupo, os testes de invariância métrica e invariância esca- 
lar podem se tornar complicados. Isso fica particularmente 
complexo quando se tenta estabelecer invariância métrica 
parcial ou invariância escalar parcial. Testes de equivalên- 
cia são úteis quando o pesquisador precisa fazer validação 
cruzada de resultados prévios ou comparar construtos en- 
tre grupos que podem não ser obtidos da mesma popula- 
ção. A segunda condição é particularmente verdadeira em 
pesquisas que ultrapassam as fronteiras de uma nação. 


Viés de medida 


Às vezes, pesquisadores ficam preocupados que respostas 
de entrevistas sejam viesadas, dependendo da maneira 
como as questões são formuladas. Por exemplo, poderia 
ser argumentado que a ordem na qual as questões são 
realizadas pode ser responsável pela covariância entre 
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itens que são agrupados proximamente. Se for o caso, um 
fator de incômodo baseado na proximidade física de itens 
de escala pode estar explicando um tanto da covariância 
entre itens. 

Analogamente, pesquisadores muitas vezes estão dian- 
te da solução da questão do viés dos métodos constantes. 
Viés dos métodos constantes implica que a covariância 
entre itens medidos é direcionada pelo fato de que algu- 
mas das respostas, ou todas, são coletadas com o mesmo 
tipo de escala. Um questionário que usa somente escalas 
diferenciais semânticas, por exemplo, pode sofrer viés 
porque a forma de resposta com termos opostos se torna 
responsável pela covariância entre os itens. Assim, a cova- 
riância poderia ser explicada pela maneira como respon- 
dentes usam um certo tipo de escala juntamente com o 
conteúdo dos itens de escala, ou no lugar deste conteúdo. 
Aqui, uma ilustração simples é dada usando o exemplo 
da HBAT. Ela mostra como um modelo de CFA pode 
ser empregado para examinar a possibilidade de vieses de 
medida na forma de um fator de incômodo. 

O questionário dos empregados da HBAT consiste de 
diversos tipos diferentes de escalas de avaliação. Apesar 
de poder ser argumentado que respondentes preferem um 
único formato em qualquer questionário, diversas vanta- 
gens surgem ao se usar um pequeno número de formatos 
distintos. Uma vantagem é que a extensão do viés sobre 
os resultados em qualquer tipo de escala em particular 
pode ser avaliada usando-se CFA. 


Neste caso, a HBAT está com receio de que os itens di- 
ferenciais semânticos estejam causando viés de medida. 
O analista argumenta que os respondentes têm padrões 
consistentes de respostas para escalas diferenciais semân- 
ticas, não importando qual seja o assunto do item. Logo, 
um fator diferencial semântico pode ajudar a explicar 
resultados. Um modelo CFA pode ser usado para testar 
esta proposição. Uma maneira de fazer isso é criando um 
construto adicional que também seja postulado como a 
causa dos itens diferenciais semânticos. Neste caso, os 
itens EP4, JS2, JS3, AC2 e SI4 são medidos com escalas 
diferenciais semânticas. Assim, o modelo precisa estimar 
caminhos entre este novo construto e esses itens medi- 
dos. A adição de um fator de incômodo deste tipo viola 
os princípios da boa medição, e assim o novo modelo não 
terá propriedades de medição congênere. 

Modificaremos o modelo CFA original da HBAT 
mostrado na Figura 11-8. Um sexto construto é introdu- 
zido (E). A seguir, caminhos de dependência (causais, 
neste caso) seriam estimados (esboçados, caso se empre- 
gue um diagrama de caminhos) de &, para EP4, JS2, JS3, 
AC2 e SI4. Logo, o padrão fatorial não exibe mais estru- 
tura simples, pois cada uma dessas variáveis medidas é 
agora determinada por seu fator conceitual e pelo novo 
construto É. 


O analista testa este modelo e observa as estatísti- 
ca de ajuste a seguir. O x = 232,6 com 174 graus de li- 
berdade, e a RMSEA, o PNFI e o CFI são 0,028, 0,80 
e 0,99, respectivamente. Os caminhos adicionados não 
fornecem um ajuste geral ruim, apesar da RMSEA ter 
crescido um pouco e o PNFI ter diminuído. Não obs- 
tante, Ax = 4,0 (236,6 — 232,6), com 5 (179 — 174) graus 
de liberdade, é insignificante. Além disso, nenhuma das 
estimativas associadas com o fator de viés (E) é signi- 
ficante. As estimativas completamente padronizadas de 
lambda (cargas fatoriais) e os valores-t correspondentes 
são mostrados aqui: 


Parâmetro Estimativa Valor-t 
Aos 0,14 1,19 
Nas —0,01 —0,08 
À 176 0,16 1,32 
À 196 0,07 0,84 
Nois 0,20 1,48 


Ainda, os valores para as estimativas paramétricas 
originais se mantêm virtualmente inalterados também. 
Assim, com base nas comparações de ajuste do modelo, 
nas estimativas insignificantes de parâmetros e na estabi- 
lidade paramétrica, nenhuma evidência sustenta a propo- 
sição de que respostas para itens diferenciais semânticos 
estejam provocando vieses nos resultados. O analista da 
HBAT conclui, portanto, que este caso não está sujeito a 
viés de medida. Outro fator poderia ser adicionado para 
atuar como potencial causa perturbadora para os itens 
representando outro tipo de escala, como todos os itens 
Likert. O teste prosseguiria de maneira muito parecida. 

O resultado final de todos esses testes é que o pesqui- 
sador pode prosseguir testando hipóteses mais específi- 
cas sobre retenção de empregados e construtos relacio- 
nados — o tópico do próximo capítulo. 


Resumo 


O amplo uso de análise fatorial confirmatória tem me- 
lhorado muito a medição quantitativa nas ciências so- 
ciais. Pesquisadores agora dispõem de uma ferramenta 
que fornece um forte teste para a teoria de mensuração 
de alguém. A principal vantagem é que o pesquisador 
pode testar analiticamente uma teoria conceitualmen- 
te fundamentada, explicando como que diferentes itens 
medidos representam importantes medidas psicológicas, 
sociológicas ou de negócios. Quando resultados de CFA 
são combinados com testes de validade de construto, pes- 
quisadores podem obter uma compreensão completa da 
qualidade de suas medidas. Portanto, quando passamos 
de procedimentos multivariados exploratórios para testes 
empíricos mais específicos de idéias conceituais, CFA se 
torna uma ferramenta multivariada essencial. 
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É difícil destacar em um parágrafo ou dois os pontos 
importantes sobre CFA. No entanto, alguns pontos estra- 
tégicos que ajudam a entender e usar CFA incluem aque- 
les correspondentes aos objetivos do capítulo: 


Distinguir entre análise fatorial exploratória e análise fa- 
torial confirmatória. CFA não pode ser conduzida ade- 
quadamente, sem que o pesquisador possa especificar o 
número de construtos que existem dentro dos dados a 
serem analisados e quais medidas específicas devem ser 
designadas para cada um desses construtos. Em contra- 
partida, EFA é conduzida sem conhecimento de qualquer 
uma dessas coisas. A EFA não fornece uma avaliação de 
ajuste. A CFA faz isso. 


Avaliar a validade de construto de um modelo de men- 
suração. Validade de construto é essencial para confir- 
mar um modelo de mensuração. Múltiplos componentes 
de validade de construto incluem validade convergente, 
validade discriminante, validade de expressão e validade 
nomológica. Confiabilidades de construto e estimativas 
de variância extraída são úteis para estabelecer validade 
convergente. Validade discriminante é sustentada quando 
a variância média extraída para um construto é maior do 
que a variância compartilhada entre construtos. Valida- 
de de expressão é estabelecida quando os itens medidos 
são conceitualmente consistentes com a definição de um 
construto. Validade nomológica é sustentada na medida 
em que um construto se relaciona com outros de uma ma- 
neira teoricamente consistente. 


Saber como representar um modelo de mensuração 
usando um diagrama de caminhos. Diagramas visuais 
ou de caminhos são ferramentas úteis para ajudar a tra- 
duzir uma teoria de mensuração em algo que possa ser 
testado usando-se procedimentos CFA padrão. Progra- 
mas SEM fazem uso desses diagramas de caminhos para 
mostrar como construtos são relacionados com variáveis 
medidas. A boa prática da medição sugere que um mo- 
delo de mensuração deve ser congênere, o que significa 
que cada variável medida deve carregar sobre apenas um 
construto. Exceto no caso em que fortes motivos teóri- 
cos indiquem o contrário, todos os construtos devem ser 
conectados com uma seta curvilínea de dois sentidos no 
diagrama de caminhos, mostrando que a correlação en- 
tre construtos será estimada. 


Entender os princípios básicos de identificação estatísti- 
ca e conhecer algumas das principais causas dos proble- 
mas de identificação da SEM. Identificação estatística 
é extremamente importante para obter resultados de 
CFA úteis. Modelos sub-identificados não podem pro- 
duzir resultados confiáveis. Modelos super-identificados 
com um número excessivo de graus de liberdade são exi- 
gidos para identificação estatística. Além disso, cada pa- 
râmetro estimado deve ser identificado estatisticamente. 


Muitos problemas associados com CFA e SEM em geral, 
incluindo aqueles de identificação e convergência, resul- 
tam de duas fontes: tamanho amostral insuficiente e nú- 
mero insuficiente de variáveis indicadoras por construto. 
O pesquisador é fortemente encorajado a fornecer uma 
amostra adequada com base nas condições do modelo e 
a planejar pelo menos três ou quatro itens medidos para 
cada construto. 


Compreender o conceito de ajuste na forma como se 
aplica a modelos de mensuração e ser capaz de avaliar 
o ajuste de um modelo de análise fatorial confirmató- 
ria. CFA é uma ferramenta multivariada que computa 
uma matriz de covariância prevista usando as equações 
que representam a teoria testada. A matriz de covariân- 
cia prevista é então comparada com a matriz de cova- 
riância real computada a partir dos dados originais. Em 
termos gerais, modelos se ajustam bem à medida que tais 
matrizes se tornam mais parecidas. Estatísticas de ajus- 
te múltiplo devem ser relatadas para ajudar a entender 
o quão bem um modelo verdadeiramente se ajusta. Elas 
incluem a estatística de qualidade de ajuste x” e graus de 
liberdade, um índice de ajuste absoluto (como o GFI ou 
a SRMR) e um índice de ajuste incremental (como o TLI 
ou o CFI). Um desses índices deve ser também um in- 
dicador de má qualidade de ajuste, como a SRMR ou a 
RMSEA. Nenhum valor absoluto para os vários índices 
de ajuste sugere bom ajuste; apenas orientações estão 
disponíveis para esta tarefa. Os valores associados com 
modelos aceitáveis variam de uma situação para outra e 
dependem consideravelmente do tamanho da amostra, 
do número de variáveis medidas e das comunalidades dos 
fatores. 


Saber como SEM pode ser usada para comparar resul- 
tados entre grupos, o que inclui a avaliação da validação 
cruzada de um modelo de mensuração. Comparações de 
múltiplos grupos podem ser úteis. Elas demandam que o 
pesquisador teste vários graus de invariância ou a igualda- 
de entre os grupos a serem comparados. A CFA fornece 
uma maneira para executar tais testes. Ax” é uma estatís- 
tica útil para testar invariância e para extrair conclusões 
sobre as diferenças entre grupos. 


Questões 


1. Como CFA difere de EFA? 

2. Liste e defina os componentes de validade de construto. 

3. Quais são os passos no desenvolvimento de uma nova medi- 
da de construto? 

4. Quais são as propriedades de um modelo de mensuração 
congênere? Por que elas correspondem às propriedades da 
boa mensuração? 

5. Quais são as considerações para determinar se indicadores 
devem ser modelados como formativos ou reflexivos? 

6. O que é um caso Heywood e como ele é tratado usando-se 
SEM? 
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10. 


11. 


Qual é a diferença entre um índice de qualidade de ajuste e 
um de má qualidade de ajuste? 

É possível estabelecer cortes precisos para índices de ajuste 
de CFA? Justifique sua resposta. 

Descreva os passos de uma busca de especificação. 

Quais condições tornam apropriado um modelo fatorial de 
segunda ordem? 

Quais condições devem ser satisfeitas a fim de se obter con- 
clusões válidas sobre diferenças em relações e diferenças em 
médias entre três grupos distintos de respondentes — um do 
Canadá, um da Itália e outro do Japão? Justifique sua res- 
posta. 


12. Um entrevistador coleta dados sobre satisfação com auto- 
móveis. Dez questões são coletadas por meio de uma entre- 
vista pessoal. Em seguida, o respondente responde outros 
20 itens, marcando-os com um lápis. Como CFA pode ser 
usada para testar se o formato da questão provoca algum 
viés sobre os resultados? 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustra problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 


Apêndice 11A 


Questões de especificação em programas SEM 


Neste apêndice fornecemos uma visão geral de questões 
de especificação em SEM para dois pacotes computacio- 
nais. Primeiro examinamos tais questões para LISREL e 
em seguida para AMOS. 


Problemas de especificação com LISREL 


Especificação é bastante diferente usando-se CFA em 
comparação com EFA. A Figura 11A-1 ilustra como o 
modelo de mensuração da HBAT é comunicado usan- 
do os comandos do programa LISREL. O usuário pode 
utilizar os menus iconográficos para gerar a sintaxe que 
corresponde ao modelo de mensuração, esboçar o modelo 
usando um diagrama de caminhos, ou escrever o código 
apropriado em uma janela de sintaxe. Se alguma das duas 
primeiras alternativas for seguida corretamente, LISREL 
pode gerar a sintaxe do programa automaticamente. A 
HBAT decidiu escrever os comandos do programa. Nú- 
meros de linhas foram adicionados à Figura 11A-1 para 
fins de referência. Os números das linhas não são necessá- 
rios como entrada em LISREL. 

A linha 01 é simplesmente uma declaração do título. O 
usuário pode escrever o que quiser nesta linha, que ajuda 
a identificar a análise. A linha 02 é uma declaração dos da- 
dos. Deve começar com DA e diz ao programa SEM que 
28 variáveis são incluídas no conjunto de dados de 399 ob- 
servações. Apesar de o conjunto original de dados ter 400 
observações, um ponto de uma resposta foi descartado 
por estar fora do intervalo, e outro por estar simplesmen- 
te faltando. Usando eliminação aos pares e a regra prática 
anterior, o número de observações foi fixado no número 
mínimo de observações para qualquer computação de co- 
variância. Neste caso, pelo menos 399 observações estão 
envolvidas em alguma computação de covariância. Este 
número pode ser verificado examinando-se a saída estatís- 
tica para as computações de covariância. Se a eliminação 
listwise tivesse sido usada, então NO seria fixado em 398, 
uma vez que ambos os casos com uma resposta perdida 
seriam eliminados de quaisquer cálculos. MA = CM sig- 
nífica que a matriz de entrada é de covariância. A linha 
03 indica que uma matriz de covariância (CM) é armaze- 
nada em um arquivo (FI) chamado HBAT.COV. A linha 
04 é uma declaração de rótulo e deve começar com LA. 
Os rótulos são listados na linha abaixo. As linhas 05 e 06 
mostram os rótulos para as 28 variáveis. Usuários podem 
escolher quaisquer rótulos que o programa respectivo 
permita. Neste caso, a HBAT rotulou as variáveis com 
iniciais (em inglês) dos nomes dos construtos, como JS1, 


JS2, ..., SI4. Poderia ter sido usado X1-X28 ou V1-V28 ou 
qualquer outra abreviação parecida. Um rótulo é neces- 
sário para cada variável no conjunto de dados. 

A linha 07 é uma declaração de escolha e deve ser 
denotada por SE (de SElect). Ela indica que as variáveis 
listadas nas próximas linhas são aquelas a serem usadas 
na análise. Uma / indica o final da lista de variáveis es- 
colhidas. A ordem é particularmente importante. O que 
quer que seja listado em primeiro lugar se torna a primei- 
ra variável observada. Por exemplo, a primeira variável 
medida no programa CFA, designada como x, (o x minús- 
culo com índice aqui representando a primeira variável 
observada selecionada e correspondendo à estimativa de 
carga »,,1), será representada pela variável introduzida 
rotulada “JS1”. “SI4”, a vigésima primeira variável na li- 
nha SE, se torna a vigésima primeira variável medida ou 
X,, € as estimativas de carga associadas com esta variável 
serão encontradas na vigésima primeira linha da matriz de 
cargas fatoriais (As de A, neste caso). 

Somente em raras circunstâncias as variáveis serão ar- 
mazenadas no arquivo original de dados, na ordem exa- 
ta que combinaria a configuração correspondente com 
a teoria sendo testada. Além disso, o usuário raramente 
inclui todas as variáveis na CFA, pois a maior parte dos 
dados também contém algumas variáveis de classificação 
ou de identificação, bem como variáveis potenciais que 
foram medidas mas não incluídas na CFA. O processo de 
seleção, seja por comandos ou pelo menu de ícones, é a 
maneira com que as variáveis envolvidas na CFA são es- 
colhidas. 

A linha 09 é uma declaração de modelo e deve come- 
çar com MO. Declarações de modelo indicam os núme- 
ros respectivos de variáveis medidas e latentes e podem 
incluir descrições das matrizes fundamentais de parâme- 
tros. As abreviações mostradas aqui são relativamente 
fáceis de se seguir. NX se refere ao número de variáveis 
x que, neste caso, é 21. NK é o número de é construtos, 
que aqui é 5. PH indica que a matriz de covariâncias entre 
os 5 construtos (&) será simétrica (SY) e livre (FR). Em 
outras palavras, as variâncias de construtos (a diagonal 
de &) e as covariâncias entre cada par de construtos se- 
rão estimadas. TD é a matriz de variâncias e covariâncias 
de erro. Ela é diagonal (DI) e livre (FR), de modo que 
apenas variâncias de erro são estimadas. Qualquer matriz 
de parâmetros não listada na linha MO é fixada no valor 
padrão do programa. O leitor pode consultar a documen- 
tação do programa quanto a outras possíveis abreviações 
e defaults. 
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01 EXEMPLO DE CFA DE HBAT 

02 DA NI=28 NO0=399 MA=CM 

03 CM FI=HBAT.COV 

04 LA 

05 ID JSl OC1 OC2 EP1 OC3 OC4 EP2 EP3 AC1 EP4 JS2 JS3 AC2 SI1 JS4 SI2 JS5 

06 AC3 SI3 AC4 SI4 C1 C2 C3 AGE EXP JP 

07 SE 

08 JS1 JS2 JS3 JS4 JS5 OC1I OC2 OC3 OC4 SI1 SI2 SI3 SI4 EPl EP2 EP3 EP4 AC1 AC2 AC3 AC4/ 
09 MO NX=21 NK=5 PH=SY,FR TD=DI,FR 

10 vA 1.0 LX 1 1 LX 6 2 LX 10 3 LX 14 4 IX 18 5 

11 FR IX 2 11X311X411LX511LX721X821X92 

12 FR LX 11 3 LX 12 3 LX 13 3 LX 15 4 LX 16 4 LX 17 4 LX 19 5 LX 20 5 1X 215 
13 LK 

14 "JS! "OC! "SI! "EP! "CA! 

15 PD 

16 OU SC RS ND=2 

FIGURA 11A-1 Asintaxe LISREL para o modelo CFA da HBAT. 


A linha 10 é uma declaração de valor (VA). Declara- 
ções deste tipo designam um valor a um parâmetro fixado. 
Neste caso, cada um dos parâmetros listados nesta linha é 
fixado em 1,0. Tal comando marca a escala para os cons- 
trutos de forma que um item é fixado em 1,0 sobre cada 
construto. LX 1,1 representa o parâmetro para a primeira 
carga sobre o primeiro construto (1,11). O L se refere a 
lambda, o X é uma variável x, e 1 e 1 correspondem aos 
números da variável medida e do construto, respectiva- 
mente. Assim, LX 2,1 se refere ao parâmetro represen- 
tando a carga fatorial da segunda variável medida (x,) 
sobre o primeiro construto latente (£,), ou seja, A, 1. Car- 
gas fatoriais em um modelo fatorial reflexivo podem ser 
igualmente expressadas como caminhos causais. Usando 
esta terminologia, LX 21,5 corresponde ao caminho do 
construto É. para x,; (115). 

As linhas 11 e 12 começam com FR e designam as esti- 
mativas de cargas livres. As 16 cargas que aparecem nes- 
sas linhas serão estimadas e mostradas como resultados 
fatoriais na saída (em A,). Com as cinco estimativas fixa- 
das em 1 na linha 10 e 16 cargas estimadas, 84 elementos 
permanecem no padrão fatorial fixados em zero (21 variá- 
veis x 5 construtos = 105 cargas potenciais; 105 —- 16-5 = 
84). Lembre-se que EFA produziria uma estimativa para 
todas as 105 cargas. O padrão de cargas livres e fixadas 
corresponde à estrutura teórica proposta no modelo de 
mensuração. Consistentemente com o modelo congêne- 
re proposto, apenas uma estimativa de carga é livre para 
cada variável indicadora medida. Em outras palavras, 
cada variável indicadora medida carrega somente sobre 
um construto. 

A linha 13 é outra declaração de rótulo. É onde os ró- 
tulos para os construtos latentes podem ser listados. LK 
se refere a rótulos para ksi (E). Os rótulos reais aparecem 
na próxima ou nas próximas linhas, se necessário. Neste 
caso, os rótulos correspondem às abreviações de constru- 


tos dadas (JS, OC, SI, EP e AC). A linha 15, com a abre- 
viação PD, pede que um diagrama de caminho seja esbo- 
çado pelo programa, descrevendo o modelo especificado 
e as estimativas de caminhos. A linha OU (16) é exigida e 
é onde qualquer uma, dentre as numerosas opções, pode 
ser requisitada. Por exemplo, a SC está requisitando que 
estimativas completamente padronizadas sejam incluídas 
na saída. RS requer que todos os resíduos resultantes da 
estimativa do modelo sejam mostrados, incluindo resídu- 
os tanto padronizados quanto não-padronizados. ND = 2 
significa que resultados serão mostrados com dois dígitos 
significativos. 

Por vezes, um pesquisador pode querer colocar res- 
trições adicionais sobre um modelo CFA. Por exemplo, 
às vezes é útil fixar dois ou mais parâmetros como sen- 
do iguais. Isso produziria uma solução que exigiria que 
os valores para esses parâmetros fossem os mesmos. Se, 
por exemplo, equivalência-tau é assumida, esta restrição 
é necessária. Com LISREL, esta tarefa pode ser realizada 
usando a linha de comando EQ. Analogamente, pesquisa- 
dores de vez em quando querem fixar um parâmetro espe- 
cífico em um valor dado usando a linha de comando VA. 
Informação adicional sobre restrições pode ser consegui- 
da na documentação do programa SEM de escolha. 


Especificação com AMOS 


Comandos de programa podem também ser escritos para 
AMOS de modo muito parecido com LISREL. Contudo, 
a suposição com AMOS é a de que o usuário trabalhará 
com um diagrama de caminhos. Essencialmente, as ins- 
truções para desenhar o diagrama de caminhos, mostrado 
na Figura 11-8, fornecem a estrutura a partir da qual se 
constrói o modelo. No entanto, o usuário deve designar 
variáveis para cada retângulo, que representa uma variá- 
vel medida, e nomes de construtos para cada oval. Ana- 
logamente, o usuário deve especificar nomes para cada 
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termo de erro de variável medida. Em seguida, as setas 
apropriadas devem ser esboçadas para formar o modelo. 
O usuário deve ser cuidadoso, para que variáveis sejam 
designadas corretamente. Ícones podem ser usados para 
adicionar restrições no modelo e para executar aplicações 
avançadas como análise de múltiplos grupos. 


Resultados usando diferentes programas SEM 


Apesar de variarem as entradas para diferentes progra- 
mas SEM, os resultados deveriam ser essencialmente 
os mesmos. Os algoritmos podem variar um pouco, mas 
um modelo que retrata bom ajuste usando um programa 
SEM deve também mostrar bom ajuste em outro. Cada 
um tem suas próprias idiossincrasias que podem impedir 
que a mesma especificação de modelo seja estimada. Por 
exemplo, alguns tornam mais ou menos difícil usar cada 
uma das opções de variáveis perdidas já mencionadas. 
Cada abordagem pode ser facilmente especificada com 
LISREL, mas AMOS usa apenas EM. Eliminação listwi- 
se, por exemplo, pode ser executada com AMOS exami- 
nando-se observações com dados perdidos antes de se co- 
meçar a rotina AMOS (p.ex., com SPSS). 

As estatísticas de ajuste geral do modelo, incluindo 
o x e todos os índices de ajuste, não deveriam variar de 
forma significativa entre os programas. Analogamente, as 
estimativas de parâmetros também não deveriam variar 


de forma a gerar consegiiências. Diferenças podem ser es- 
peradas em duas áreas. 

Uma área na qual diferenças nas estimativas numéri- 
cas podem variar está nos resíduos. Em particular, algu- 
mas diferenças podem ser encontradas entre AMOS e os 
demais programas. Sem entrar nos detalhes, AMOS usa 
um método diferente para escalonar os termos de erro de 
variáveis medidas, em comparação com outros progra- 
mas. Este formato tem a ver com o estabelecimento da 
escala de termos de erro, parecido com a maneira como 
estabelecemos a escala para os construtos latentes em um 
modelo SEM. Este método pode provocar diferenças re- 
lativamente pequenas nos valores para resíduos e resídu- 
os padronizados computados com AMOS. No entanto, as 
diferenças não afetam as regras práticas dadas neste ca- 
pítulo. 

Outra área na qual estimativas numéricas podem va- 
riar é nos índices de modificação. Novamente, AMOS as- 
sume uma abordagem computacional diferente dos outros 
programas SEM. A diferença reside em se a mudança no 
ajuste é isolada em um ou diversos parâmetros. Uma vez 
mais, apesar de o usuário poder encontrar diferenças em 
MI na comparação entre AMOS e outros programas, tais 
diferenças não devem ser tão grandes a ponto de afetarem 
as conclusões na maioria das situações. Assim, novamen- 
te, as regras práticas para o MI valem para qualquer pro- 
grama SEM. 


Apêndice 11B 


Variável medida e termos de intercepto no construto 


Frequentemente se torna necessário usar as médias de 
variável medida e variável latente para tirar conclusões 
sobre similaridades e diferenças entre grupos. Até ago- 
ra, nenhuma equação de SEM mostrou um valor médio. 
Agora, no entanto, as médias devem ser consideradas. 

Uma maneira de perceber o valor médio de qualquer 
variável medida é pensar nela como a soma de seu ter- 
mo de intercepto-zero com a carga fatorial, vezes o valor 
médio do construto latente. Em forma matemática, isso 
se parece com o que se segue, expresso em termos de x, 
[15]: 


My = Eq Aka 


O x, representa o valor médio para o primeiro cons- 
truto latente É, o w.,, corresponde à média da variável 
medida x,, € o 7, é O intercepto-zero para x,. Em termos 
mais gerais, x representa a média para qualquer construto 
latente. Matematicamente, é também o termo de intercep- 
to-zero quando se isola E Ainda que a matemática neste 
cálculo possa ser difícil de se acompanhar, é importante 
saber que a menos que instruções específicas sejam dadas 
ao programa SEM, ele não considerará e nem estimará 
médias de construtos de tipo algum. 

Esta equação pode ser reescrita para isolar 7, OU k. 
Se alguma hipótese se refere a diferenças entre médias de 
construtos, tais diferenças podem ser encontradas nos va- 
lores relatados para x. 
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CAPÍTULO 


SEM: Teste de um Modelo Estrutural 


OBJETIVOS DE APRENDIZAGEM 


Ao completar este capítulo, você deverá ser capaz de fazer o seguinte: 


Distinguir um modelo de mensuração de um modelo estrutural. 

Descrever as similaridades entre SEM e outras técnicas multivariadas. 

Descrever um modelo com relações de dependência usando um diagrama de caminhos. 
Testar um modelo estrutural usando SEM. 

Diagnosticar problemas com resultados de SEM. 

Compreender os conceitos de mediação e moderação estatística. 


APRESENTAÇÃO DO CAPÍTULO 


O processo de testar um modelo de equações estruturais (SEM) foi introduzido no Capítulo 10 como 
algo que envolve dois modelos identificáveis. O Capítulo 11 descreveu o primeiro modelo em SEM com 
uma visão geral do desenvolvimento de um modelo de mensuração com base em teoria e, em seguida, 
seu teste com análise fatorial confirmatória (CFA). CFA foi comparada e contrastada com análise fatorial 
exploratória (EFA) para ilustrar os conceitos que elas têm em comum como cargas fatoriais, covariância 
e correlação. CFA testa teoria de mensuração baseada na covariância entre todos os itens medidos. 
Como tal, o modelo CFA fornece a fundamentação para todo o restante do teste da teoria. 

Este capítulo se concentra no segundo modelo: testar o modelo teórico ou estrutural, onde o principal 
foco se desvia para as relações entre construtos latentes. Com SEM, examinamos relações entre construtos 
latentes de forma parecida como examinamos as relações entre variáveis independentes e dependentes 
em análise de regressão múltipla (Capítulo 4). Ainda que tenhamos visto que fatores múltiplos representan- 
do construtos teóricos poderiam entrar como variáveis em modelos de regressão, estes modelos tratavam 
variáveis e construtos exatamente da mesma forma. Ou seja, regressão múltipla não leva em conta qual- 
quer uma das propriedades de mensuração que acompanham a formação de um construto de múltiplos 
itens quando se estima a relação. SEM fornece uma maneira melhor de empiricamente examinar um mode- 
lo teórico por meio do envolvimento do modelo de mensuração e do modelo estrutural em uma análise. Em 
outras palavras, ela leva em conta informações sobre mensuração no teste do modelo estrutural. 

O capítulo começa descrevendo um pouco da terminologia associada com o teste do modelo estru- 
tural com SEM. Além disso, discutimos as similaridades e diferenças entre SEM e outras técnicas mul- 
tivariadas. Descrevemos então os dois últimos estágios (5 e 6) no processo de seis passos para testar 
modelos teóricos e fornecer uma ilustração usando o banco de dados de HBAT SEM. O capítulo finaliza 
com uma visão geral de diversos tópicos avançados. Diversos apêndices tratam dos detalhes das 
equações estruturais em si, bem como de alguns detalhes associados com o uso de programas SEM. 


Termos-chave gia usada. Ao longo do capítulo os termos-chave aparecem 

em negrito. Outros pontos de ênfase no capítulo e referências 
Antes de começar este capítulo, reveja os termos-chave para cruzadas de termos estão em itálico. Exemplos ilustrativos es- 
desenvolver uma compreensão dos conceitos e da terminolo- — tão em quadros. 
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Análise post hoc Testes após-o-fato de relações para as quais 
nenhuma hipótese foi teorizada. Em outras palavras, um cami- 
nho é testado onde a teoria original não indicou um caminho. 

Confusão de interpretação Estimativas de medida para um 
construto são significantemente afetadas por relações que 
não são aquelas entre as medidas específicas. É indicada 
quando estimativas de cargas variam substancialmente de 
um modelo SEM para outro que é o mesmo exceto pela mu- 
dança de especificação de uma ou mais relações. Diferenças 
em estimativas de cargas indicam dificuldade para separar 
qual item indicador mede um construto latente em particular. 

Efeito direto Relação que conecta dois construtos com uma 
seta entre eles. 

Efeito indireto Sequência de relações com pelo menos um 
construto mediador envolvido. Ou seja, uma sequência de 
dois ou mais efeitos diretos visualmente representados por 

múltiplas setas entre construtos. 

Efeito mediador Efeito de uma terceira variável/construto inter- 

mediando entre dois outros construtos relacionados. 

Efeito moderador Efeito de uma terceira variável ou construto 

que muda a relação entre duas variáveis/construtos relacio- 

nadas. Ou seja, um moderador significa que a relação entre 
duas variáveis muda com base na quantia que uma outra va- 
riável acrescentou ao modelo. 

Estimativa paramétrica estrutural O equivalente SEM de um 
coeficiente de regressão que mede a relação linear entre um 
preditor e um resultado. 

Mediação completa Relação entre uma variável preditora e 
uma variável resultado se torna insignificante depois que um 
mediador entra como preditor adicional. 

Mediação parcial Efeito quando uma relação entre um preditor 
e um resultado é reduzida, mas permanece significante quan- 
do um mediador também entra como um preditor adicional. 

Mínimos quadrados parciais (PLS) Abordagem alternativa de 
estimação para SEM tradicional. Os construtos são represen- 
tados como compostos, com base em resultados de análise 
fatorial, sem tentativa de recriar covariâncias entre itens me- 
didos. 

Modelo causal Modelo estrutural que infere que relações têm 
uma ordem sequencial na qual uma mudança de um lado traz 
uma mudança no outro. 

Modelo estrutural Teoria estrutural correspondente com um 
conjunto de equações estruturais que pode ser descrito por 
meio de um diagrama visual. 

Modelo estrutural saturado Modelo SEM recursivo que especi- 
fica o mesmo número de relações estruturais diretas em com- 
paração com o número de possíveis correlações de constru- 
tos na CFA. As estatísticas de ajuste para um modelo teórico 
saturado devem ser as mesmas obtidas para o modelo CFA. 

Modelo não-recursivo Modelo estrutural contendo retornos de 
resposta. 

Modelos recursivos Modelos estruturais nos quais todos os 
caminhos entre construtos prosseguem somente do constru- 
to antecedente para as consequências (construto resultado). 
Um modelo recursivo não contém retornos de resposta com 
setas operando em um sentido oposto daquelas que origina- 
ram o modelo. 


Processo SEM de dois passos Abordagem para SEM na qual 
o ajuste do modelo de mensuração e a validade de construto 
são avaliados primeiramente usando-se CFA e, em seguida, 
o modelo estrutural é testado, incluindo uma avaliação da sig- 
nificância de relações. O modelo estrutural é testado somente 
depois que mensuração adequada e validade de construto 
tenham sido estabelecidas. 

Retorno de resposta Relação quando um construto é visto 
como preditor e resultado de outro construto. Retornos de res- 
posta podem envolver relações diretas ou indiretas. Também 
conhecido como um modelo não-recursivo. 

Teoria estrutural Representação conceitual das relações entre 
construtos. 

Unidade de análise Unidade ou nível para os quais resultados se 
aplicam. Em pesquisas sobre negócios, ela frequentemente lida 
com a escolha de testes de relações entre percepções indivi- 
duais (de pessoas) ou testes de relações entre organizações. 


O QUE É UM MODELO ESTRUTURAL? 


No capítulo anterior, aprendemos que a meta da teoria 
de mensuração é produzir maneiras de medir conceitos 
de uma forma confiável e válida. Teorias de mensuração 
são testadas pela qualidade com que as variáveis indica- 
doras de construtos teóricos se relacionam entre si. As re- 
lações entre os indicadores são capturadas em uma matriz 
de covariância. CFA testa uma teoria de mensuração pelo 
fornecimento de evidência sobre a validade de medidas in- 
dividuais com base no ajuste geral do modelo e outras evi- 
dências de validade de construto. CFA por si só é limitada 
em sua habilidade para examinar a natureza de relações 
entre construtos além de simples correlações. Uma teoria 
de mensuração é então frequentemente um meio para a 
meta de examinar relações entre construtos, e não pro- 
priamente a meta em si. 

Uma teoria estrutural é uma representação conceitual 
das relações entre construtos. Ela pode ser expressa em 
termos de um modelo estrutural que representa a teoria 
com um conjunto de equações estruturais e é geralmente 
descrita com um diagrama visual. Modelos estruturais são 
conhecidos por diversos nomes, incluindo um modelo te- 
órico ou, ocasionalmente, um modelo causal. Um modelo 
causal infere que as relações atendem às condições neces- 
sárias para causalidade. As condições para causalidade 
foram discutidas no Capítulo 10 e o pesquisador deve ser 
muito cuidadoso para não descrever que o modelo tem 
inferências causais, a menos que todas as condições sejam 
atendidas. 


UM EXEMPLO SIMPLES DE UM 
MODELO ESTRUTURAL 


A transição de um modelo de mensuração para um estru- 
tural é estritamente a aplicação da teoria estrutural em 
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termos de relações entre construtos. Como você deve lem- 
brar do Capítulo 11, um modelo de mensuração contém 
tipicamente todos os construtos com relações não-causais 
ou correlacionais entre eles. O modelo estrutural aplica 
a teoria estrutural pela especificação de quais construtos 
são relacionados entre si e da natureza de cada relação. 
Revemos nosso exemplo simples de modelo de mensura- 
ção do Capítulo 11 para ilustrarmos este ponto. 


A Figura 12-1 ilustra um modelo estrutural simples. Se 
prosseguirmos a partir da figura correspondente do ca- 
pítulo anterior (Figura 11-1), a suposição agora é que o 
primeiro construto, Gastos de Cliente, está relacionado 
com o Comprometimento de Cliente de uma maneira que 
a relação pode ser capturada por um coeficiente de re- 
gressão. Em uma teoria causal, o modelo implicaria que 
Gastos de cliente causa, ou ajuda a produzir, Comprome- 
timento de Cliente. 


Quando passamos de modelos de mensuração para es- 
truturais, algumas mudanças ocorrem também com abre- 
viações, terminologias e notações. O diagrama visual na 
Figura 12-1 é semelhante ao modelo CFA na Figura 11-1. 
Não foram feitas modificações no lado esquerdo do dia- 
grama que representa o construto Gastos de cliente (£,). 
Mudanças em outras áreas incluem o seguinte: 


e A relação entre os construtos Gastos de Clientes e 
Comprometimento de Cliente na Figura 11-1, que 
foi representada por um arco de dois sentidos, agora 
é representada na Figura 12-1 por uma seta em um 
sentido. Esta seta pode ser pensada como uma relação 
representada por um coeficiente de regressão. Este 
caminho mostra a direção da relação dentro de um 
modelo estrutural e representa a relação estrutural 
que será estimada. Não é fundamentalmente diferente 
do coeficiente que seria estimado para esta relação 
se regressão múltipla fosse empregada. Contudo, ele 
raramente teria o mesmo valor usando SEM, pois mais 
informação é usada para derivar seu valor, incluindo 
informação que permite uma correção para erro de 
mensuração. 


Gastos 
de clientes 


Comprometimento 
de clientes 


FIGURA 12-1 Representação visual (diagrama de caminhos) de 
uma teoria estrutural simples. 


e O construto Comprometimento de Cliente é agora 
representado pela notação m,. Esta notação é impor- 
tante porque agora devemos distinguir entre construtos 
tanto quanto distinguimos entre variáveis em análise 
de regressão. A teoria é testada pelo exame do efeito 
de construtos exógenos (preditores) sobre construtos 
endógenos (resultados). Além disso, se existem dois ou 
mais construtos endógenos, o modelo SEM pode exami- 
nar o efeito de um construto endógeno sobre outro. 

e As variáveis indicadoras medidas não são mais todas 
representadas pela letra x. Ao invés disso, as variáveis 
indicadoras para o construto exógeno são representa- 
das pela letra x. Em contrapartida, as variáveis indi- 
cadoras para o construto endógeno são representadas 
pela letra y. Esta abordagem é típica em SEM e é 
consistente com a técnica usada em outros procedi- 
mentos multivariados (x associada com preditores e y 
correspondente a resultados). O Apêndice 12A trata 
de equações para x e y. 

e Os termos de variância de erro agora têm uma notação 
que combina com a distinção entre construtos exógenos 
e endógenos. Termos de erro para as variáveis x não fo- 
ram alterados e têm um símbolo ô. Termos de erro para 
as variáveis y são representados por e. 

e As estimativas de cargas também são modificadas 
para indicar construtos exógenos e endógenos. Esti- 
mativas de cargas das variáveis para construtos exó- 
genos são denotadas por À,, enquanto que estimativas 
de cargas das variáveis para construtos endógenos são 
denotadas por À. 


Com tais distinções teóricas representadas no mo- 
delo estrutural e no diagrama de caminhos, agora pas- 
samos para a estimação do modelo estrutural usando 
procedimentos SEM. 


Resumo 


Modelos estruturais diferem de modelos de mensuração 
no sentido de que a ênfase passa da relação entre constru- 
tos latentes e variáveis medidas para a natureza e magni- 
tude das relações entre construtos. Modelos de mensura- 
ção são testados usando-se apenas CFA. O modelo CFA 
é então alterado com base na natureza de relações entre 
construtos. O resultado é a especificação de um modelo 
estrutural que é usado para testar o modelo teórico su- 
posto. Sempre que um modelo é modificado, a matriz de 
covariância estimada muda, com base no conjunto de re- 
lações estimadas sob uso (ver Apêndice 124). A matriz 
de covariância observada não muda. Na maioria dos ca- 
sos, o ajuste do modelo estrutural não será o mesmo que 
o ajuste do modelo de CFA. O exemplo que acabamos 
de rever (Figura 12-1) é uma situação especial na qual as 
qualidades de ajuste dos modelos de CFA e estrutural são 
idênticas, pois o pesquisador estima uma única relação di- 
reta entre cada par de construtos. É incomum entre as si- 
tuações nas quais modelos mais realistas e complexos são 
representados. 
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UMA VISÃO GERAL DE TESTE 
DE TEORIA COM SEM 


O teste de modelos teóricos usando SEM se concentra em 
duas questões: 


e O ajuste geral e relativo do modelo 

e O tamanho, a direção e a significância das estimativas para- 
métricas estruturais, descritas com setas em um sentido em 
um diagrama de caminhos 


O modelo teórico descrito na Figura 12-2 é avaliado 
com base na qualidade com que ele reproduz a matriz de 
covariância observada e na significância e direção dos ca- 
minhos supostos. Se o modelo mostra bom ajuste e se os 
caminhos supostos são significantes e na direção prevista 
(todos positivos, neste caso), então o modelo é sustenta- 
do. No entanto, bom ajuste não significa que algum mo- 
delo alternativo não possa se ajustar melhor ou ser mais 
preciso. Assim, mais verificações se fazem necessárias, 
incluindo um teste de plausibilidade teórica. Um teste de 
plausibilidade teórica verifica se as relações fazem senti- 
do. Se não for o caso, elas não são confiáveis. 

O Apêndice 12A descreve derivação das estimativas 
de caminhos, bem como a maneira como SEM é parecida 
com as equações multivariadas introduzidas em capítulos 
anteriores. Isso explica a relação entre variáveis medidas 
e os construtos latentes, bem como as relações entre cons- 
trutos latentes. O leitor pode achar esta informação útil 
para aprender como comunicar conceitos de SEM. 


ESTÁGIOS NO TESTE DE 
TEORIA ESTRUTURAL 


Teste de teoria com SEM segue de modo muito próximo 
a maneira como teoria de mensuração é testada usando 
CFA. O processo é conceitualmente parecido, no sentido 
de que uma teoria é proposta e então testada com base no 


Atmosfera 


(Ea) 


Gastos 
de Clientes 
(nj) 


quão bem ela se ajusta aos dados. Agora, quando lidamos 
com as relações teóricas entre construtos, maior atenção 
é focada nos tipos diferentes de relações que podem exis- 
tir. 


Abordagens de um passo versus dois passos 


Ainda que SEM tenha a vantagem de simultaneamente 
estimar os modelos de mensuração e estrutural, nosso 
processo geral de seis estágios é consistente com um pro- 
cesso SEM de dois passos [2]. Por dois passos queremos 
dizer que no primeiro testamos o ajuste e a validade de 
construto do modelo proposto de mensuração. Uma vez 
que um modelo satisfatório de mensuração é obtido, o 
segundo passo é testar a teoria estrutural. Assim, dois 
testes fundamentais — um de medição e outro estrutural 
— avaliam totalmente ajuste e validade. No Capítulo 10, 
nos referimos a isso como teste de SEM em duas partes. O 
ajuste do modelo de mensuração fornece então uma base 
para avaliação da validade da teoria estrutural [3]. 

Alguns argumentam a superioridade de uma aborda- 
gem de um passo, na qual o ajuste geral de um modelo é 
testado sem se preocupar com uma separação entre mo- 
delo de mensuração e estrutural [9]. Porém, um modelo 
de um passo oferece somente um teste-chave de ajuste e 
validade. Não diferencia a avaliação do modelo de men- 
suração da avaliação do modelo estrutural. 

O teste em separado do modelo de mensuração por 
meio de uma abordagem de dois passos é visto como es- 
sencial, uma vez que testes de teoria estrutural válida não 
podem ser conduzidos com medidas ruins. Em outras pa- 
lavras, com medidas ruins não saberíamos o que os cons- 
trutos realmente significam. Portanto, se um modelo de 
mensuração não pode ser validado, pesquisadores devem 
primeiramente refinar suas medidas e coletar novos dados. 
Se o modelo de mensuração revisado pode ser validado, 
então, e somente então, aconselhamos prosseguir com um 
teste do modelo estrutural completo. Uma discussão mais 


Comprometimento 
de Clientes 
(no) 


FIGURA 12-2 Um modelo teórico expandido de comprometimento de clientes. 


Nota: Correlações entre construtos exógenos foram omitidas da figura para fins de simplificação. Elas não são de interesse teórico prioritário. Somente as 


relações de dependência tratam de hipóteses. 
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detalhada desta questão é apresentada adiante neste capí- 
tulo na seção sobre confusão de interpretação. Referências 
nesta seção identificam fontes para uma discussão mais 
aprofundada. 

Os seis estágios de SEM agora continuam. Os estágios 
1-4 cobriram o processo CFA desde a identificação de cons- 
trutos do modelo até a avaliação da validade do modelo de 
mensuração. Se a medição é considerada suficientemente 
válida, o pesquisador pode testar um modelo estrutural 
composto dessas medições, conduzindo-nos aos estágios 5 
e 6 do processo SEM. O estágio 5 envolve a especificação 
do modelo estrutural, e no estágio 6 avalia-se sua validade. 


Estágio 5: Especificação do modelo estrutural 


Agora nos voltamos para a tarefa de especificar o mode- 
lo estrutural. Este processo envolve a determinação da 
unidade apropriada de análise, a representação visual da 
teoria usando um diagrama de caminhos, esclarecer quais 
construtos são exógenos e endógenos, bem como diversas 
questões relacionadas, como tamanho da amostra e iden- 
tificação. 


Unidade de análise 

Uma questão não visível em um modelo é a unidade de 
análise. O pesquisador deve garantir que as medidas do 
modelo capturem a unidade adequada de análise. Por 
exemplo, pesquisadores organizacionais frequentemente 
se defrontam com a escolha de testes de relações entre 
percepções individuais versus a organização como um 
todo. Percepções individuais representam a opinião ou 
sentimentos de uma pessoa. Fatores organizacionais re- 
presentam características que descrevem uma organiza- 
ção. Um construto como esprit de corps de empregados 
pode bem existir tanto no nível individual quanto organi- 
zacional. Esprit de corps pode ser pensado como o grau de 
entusiasmo que um empregado tem pelo trabalho e pela 
firma. Desse modo, um empregado pode ser comparado 
com outro. Mas também pode ser imaginado como uma 
característica da firma em geral. Dessa maneira, uma fir- 
ma pode ser comparada com outra. A escolha de unidade 
de análise determina como uma escala é tratada. 


Uma escala de múltiplos itens poderia ser usada para 
avaliar o construto esprit de corps. Se a unidade de aná- 
lise desejada está no nível individual e se queremos en- 
tender relações que existem entre indivíduos, a pesquisa 
pode prosseguir com respostas individuais. No entanto, 
se a unidade de análise é a organização, ou qualquer ou- 
tro grupo, respostas devem ser agregadas para todos os 
indivíduos respondendo por aquele grupo em particu- 
lar. Assim, os estudos de nível organizacional requerem 
consideravelmente mais dados, pois múltiplas respostas 
devem ser agregadas em um grupo. 


Uma vez que a unidade de análise é decidida e os da- 
dos são coletados, o pesquisador deve agregar os dados se 
respostas em nível de grupos são usadas para preparar a 
SEM apropriada. Se a unidade de análise for a individual, 
o pesquisador pode prosseguir como antes. 


Especificação de modelo usando 

um diagrama de caminhos 

Agora consideramos como uma teoria é representada por 
diagramas visuais. Caminhos indicam relações. Parâme- 
tros fixados correspondem a uma relação que não será es- 
timada pela rotina SEM, tipicamente assumidos como O e 
não exibidos em um diagrama visual. Parâmetros livres se 
referem a uma relação que será estimada pelo programa 
de SEM. Geralmente eles são descritos por uma seta em 
um diagrama visual. 


A Figura 12-2 retrata parâmetros livres e fixados. Por 
exemplo, nenhuma relação é especificada entre preço 
e comprometimento de Cliente. Logo, nenhuma seta é 
mostrada aqui e a teoria assume que este caminho é 
igual a zero. Mas um caminho entre Gastos de Clien- 
te e Comprometimento de Cliente representa a relação 
entre esses dois construtos, para a qual um parâmetro 
será estimado. 


Os parâmetros que representam relações estruturais 
entre construtos são agora nosso foco. Eles são, em mui- 
tos sentidos, o equivalente a coeficientes de regressão, e 
podem ser interpretados de maneira parecida. Com SEM, 
tais parâmetros são divididos em dois tipos: 


e Deconstrutos exógenos (E) para construtos endógenos (m). 
Representa-se pelo símbolo y (gama). A matriz gama (1) 
contém todas as relações a serem estimadas entre cons- 
trutos exógenos e endógenos (ver Apêndice 10B para de- 
finições de símbolos gregos). 

e De construto endógeno para construtos endógenos. Referi- 
do pelo símbolo B. O conjunto de coeficientes 8 para um 
dado modelo são capturados em uma matriz chamada de 
beta (B). 


Essas duas matrizes contêm as estimativas paramétri- 
cas correspondentes aos caminhos básicos teorizados para 
um dado modelo estrutural. 


Início com um modelo de mensuração. Uma vez que 
uma teoria é proposta, o modelo SEM é desenvolvido. 
Primeiro, a teoria de mensuração é especificada e vali- 
dada com CFA. Em seguida, a teoria estrutural é repre- 
sentada pela especificação do conjunto de relações entre 
construtos. Algumas serão estimadas, o que significa que 
a teoria estabelece que dois construtos estão relacionados 
entre si. Algumas serão fixadas, o que significa que a teo- 
ria estabelece que os dois construtos não estão relaciona- 
dos entre si. 
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(a) Modelo CFA 


D,, 


(b) Modelo estrutural 


Nas 


FIGURA 12-3 Modificação de um modelo CFA para um modelo estrutural. 


Nota: Os termos de variância de erro são omitidos do diagrama para fins de simplicidade. No entanto, em diagramas de caminhos SEM -— particularmente 
aqueles usados em AMOS -— cada termo de erro deve ser incluído como se mostra no capítulo anterior (Figura 11-1). 


* N. de R. T.: As notações corretas seriam “X,, X,o, X1, X13, X13, Xi4 Xis € Xiç”. 


A computação dos graus de liberdade será útil para 
comparação com o modelo estrutural. Uma matriz 16 x 
16 de covariância existe porque 16 variáveis medidas são 
empregadas. Assim, o número total disponível de graus 
de liberdade é igual a 136 [(16 x 17)/2 = 136]. Um total de 
38 parâmetros será estimado:* 


A Figura 12-3 mostra um modelo CFA e um subseqgiien- 
te modelo estrutural. Os construtos são designados pe- 
las letras A, B, Ce D, no lugar de nomes. As notações 
SEM apropriadas também são incluídas para ajudar 
na discussão e diferenciar entre os tipos de variáveis e 
construtos. A Figura 12-3a mostra uma CFA que testa 
o modelo de mensuração especificado. Cada construto 
é indicado por quatro itens indicadores. Assim, quatro 
construtos latentes (E, — E) são mensurados por 16 va- 
riáveis medidas (x,— x,,). Os termos de variância de erro 
não são exibidos na figura, mas cada um dos 16 itens 
indicadores também tem um termo correspondente de 
variância de erro que é estimado no modelo CFA. Re- 
lações entre construtos são estimadas pelos coeficientes 


16 estimativas de carga (1) 
16 termos de variância de erro (0,) 
+ 6 termos de covariância de construto (q) 


38 parâmetros 


* Esta computação se aplica se a escala de construto está definida 
com os termos de variância para os construtos. Se a escala estivesse 
marcada estabelecendo uma estimativa de carga igual a 1 para cada 


de correlação/covariância (db). Neste caso, existem seis 
termos de covariância/correlação entre construtos. 


construto, então a computação equivalente envolveria 12 estimati- 
vas de cargas (X), 16 termos de variância de erro (0;) e 10 termos de 
variância-covariância de construtos (q). 
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Assim, a teoria de mensuração é testada por uma CFA 
com 136 — 38 = 98 graus de liberdade (df). O valor (x) 
resultante terá, portanto, 98 df. 


Finalização do modelo estrutural. No modelo estrutu- 
ral, setas de dois sentidos são substituídas por um número 
menor de setas em um só sentido. A teoria estrutural é 
criada pela restrição da matriz de covariância usando o 
conjunto de parâmetros livres e fixados que representam 
relações teorizadas. 


Suponha que a teoria estabeleça que os construtos A e B 
são relacionados com o construto C. Esta teoria implica 
uma única relação estrutural com C como uma função 
de A e B. Quando o construto D é incluído, ele é visto 
como um resultado de C. Os construtos A e B não são 
tidos como diretamente relacionados com D. 


7. Não são mostradas relações entre Ae DouBeD, 
pois elas são fixadas em 0, com base em nossa teoria. 
Ou seja, a teoria não supõe uma relação direta entre 
AecDouBeD. 

8. Dois novos termos surgem: é, e &. Eles representam 
a variância de erro de previsão para os dois constru- 
tos endógenos. Eles podem ser considerados como 
o oposto de um KR. uma vez que são completamente 
padronizados. Ou seja, são semelhantes ao resíduo 
em análise de regressão. 


A Figura 12-3b corresponde à teoria estrutural. Diver- 
sas mudanças podem ser percebidas na transformação do 
modelo de mensuração no modelo estrutural: 


1. A teoria proposta envolve dois construtos exógenos 
e dois endógenos. Os construtos A e B são exógenos 
porque nenhuma outra seta aponta para eles a não 
ser a seta de correlação de dois sentidos. O constru- 
to C é uma função de A e B e é, portanto, endóge- 
no (com setas apontando para ele). O construto D 
é uma função de C e, pelo mesmo motivo, também 
é endógeno. Logo, a representação de construtos A 
e B não é mudada. A é representado por é. B é re- 
presentado por é. Contudo, C e D são endógenos e 
agora são representados por m, e m,, respectivamen- 
te. 

2. Outra modificação segue da nova representação de 
construtos como exógenos ou endógenos. Observe 
que itens medidos para construtos endógenos são 
agora representados por y, — y, € Y;— Ys para os cons- 
trutos Ce D, respectivamente. 

3. Os coeficientes paramétricos que representam os 
caminhos com cargas para construtos endógenos as- 
sumem as novas abreviações como À,,,ah,,€CA,ça 
À,» refletindo a mudança, conforme observado. 

4. O único coeficiente de covariância (9,1) é represen- 
tado pela seta de dois sentidos entre os construtos 
exógenos A e B. Ele representa a covariância entre 
Ae B. Os coeficientes q que representavam cova- 
riância entre outros construtos não existem mais, 
pois a matriz de covariância inclui somente relações 
entre construtos exógenos. 

5. As relações teorizadas entre Ae Ce Be C são re- 
presentadas por y,, € Y,», respectivamente. 

6. A relação teorizada entre C e D é agora representa- 
da por B,,. 


Uma vez que essas mudanças sejam implementadas, o 
modelo estrutural pode ser estimado. Como ocorre com o 
modelo CFA, há 136 graus de liberdade disponíveis a pa- 
rir dos 16 indicadores. Como mostrado abaixo, o modelo 
SEM agora estima 36 coeficientes paramétricos (usando 
36 graus de liberdade): 


16 estimativas de cargas (8 A, e 8 Ay) 
16 termos de variância de erro (8 0, e 8 0.) 
2 termos estruturais exógeno-endógeno (w) 
1 termo estrutural endógeno-endógeno (B) 
+ 1 termo de covariância de construto (q) 


36 parâmetros livres 


O modelo estrutural será testado por um valor x” com 
100 (136 — 36) graus de liberdade, dois a mais do que no 
modelo CFA. Os dois graus de liberdade surgem da restri- 
ção dos construtos A e B de serem diretamente relaciona- 
dos com D. Ao invés disso, ambos são relacionados com 
C, que, por sua vez, prevê D. 

O Apêndice 12C descreve mudanças necessárias na 
sintaxe de LISREL para converter declarações CFA no 
modelo de mensuração no topo da Figura 12-3 para o 
modelo SEM exibido na parte de baixo da mesma figu- 
ra. Usando essas modificações, um modelo SEM pode ser 
executado. Com AMOS, o usuário precisaria mudar as se- 
tas, usando a interface gráfica, para mostrar como as rela- 
ções correlacionadas de CFA se transformam em relações 
de dependência de SEM e acrescentam termos de erro às 
variáveis endógenas. 


Modelos recursivos e não-recursivos. Uma distinção fi- 
nal pode ser feita para determinar se o modelo estrutural 
é recursivo ou não-recursivo. Um modelo é considerado 
recursivo se todos os caminhos entre construtos procedem 
apenas do construto preditor (antecedente) para o cons- 
truto dependente ou de saída (consequências). Em outras 
palavras, um modelo recursivo não contém construtos 
que sejam determinados por algum antecedente e ajudem 
a determinar aquele antecedente (isto é, nenhum par de 
construtos tem setas seguindo em ambos os caminhos 
entre eles). Modelos recursivos SEM jamais têm menos 
graus de liberdade do que um modelo CFA que envolve 
os mesmos construtos e variáveis. 
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Em contrapartida, um modelo não-recursivo contém 
retornos de resposta. Um retorno de resposta existe quan- 
do um construto é visto como preditor e resposta de outro 
construto. O retorno de resposta pode envolver relações 
diretas ou até mesmo indiretas. Na relação indireta, a res- 
posta ocorre por meio de uma série de caminhos ou mes- 
mo mediante termos de erro correlacionados. 


A Figura 12-4 ilustra um modelo estrutural que é não- 
recursivo. Note que o construto D (m,) é determinado 
por € (m,) e também o determina. Os parâmetros para o 
modelo incluem os coeficientes de caminhos correspon- 
dentes a ambos os caminhos (PB, , e B,,). 

Se o modelo incluísse um caminho do construto D de 
volta ao B, o modelo também seria não-recursivo, pois 
o construto D seria indiretamente determinado por B, o 
qual também seria diretamente determinado por D com 
este novo caminho. 


Uma interpretação teórica de uma relação não-recur- 
siva entre dois construtos é que um é tanto causa como 
efeito do outro. Apesar de essa situação ser improvável 
com dados cross-section, torna-se mais plausível com da- 
dos longitudinais. É difícil produzir um conjunto de con- 
dições que sustentem uma relação recíproca com dados 
cross-section. Retornaremos brevemente para modelos 
SEM com dados longitudinais quando cobrirmos tópicos 
avançados neste capítulo. 


Por exemplo, tanto inteligência quanto sucesso na escola 
podem ser pensados como construtos latentes medidos 
por múltiplos itens. Inteligência é causa de sucesso na es- 
cola ou o sucesso provoca inteligência? Será que ambas 
são causas uma da outra? Dados longitudinais podem 
ajudar a lidar com tal questão, pois a segiência temporal 
de eventos pode ser levada em conta. 


Modelos não-recursivos também apresentam proble- 
mas com identificação estatística. Incluindo construtos 


FIGURA 12-4 Modelo SEM não-recursivo. 


adicionais e/ou variáveis medidas, podemos ajudar a ga- 
rantir que a condição de ordem seja atendida. A condição 
de classificação para identificação poderia permanecer 
problemática, porém, porque uma única estimativa para 
um só parâmetro pode não mais existir (ver Capítulo 11). 
Logo, recomendamos que se evitem modelos não-recursi- 
vos, particularmente com dados cross-section. 


Resumo. Depois de seguir os procedimentos nesta se- 
ção, a teoria do pesquisador deveria ser representada de 
uma maneira que possa ser testada. Se o pesquisador co- 
meça com um modelo de mensuração, é relativamente 
fácil fazer os ajustes necessários para transformar a repre- 
sentação da teoria de mensuração em uma representação 
da teoria estrutural. Agora estamos prontos para aplicar 
este teste usando dados de um estudo planejado para tes- 
tar a SEM. 


Delineamento do estudo 

Sempre que SEM é usada, tamanho da amostra e iden- 
tificação são pontos importantes. O Capítulo 11 cobriu 
condições para identificação com um tamanho amostral 
adequado ao longo de várias situações. Se essas condições 
são atendidas para o modelo CFA, elas são provavelmen- 
te satisfeitas para o modelo estrutural também, especial- 
mente para modelos estruturais recursivos. Um modelo 
estrutural é aninhado dentro de um modelo CFA e é mais 
parcimonioso porque contém menos caminhos estimados. 
Portanto, se o modelo CFA é identificado, o estrutural 
também deve ser identificado — desde que o modelo seja 
recursivo, nenhum termo de interação seja incluído, o ta- 
manho da amostra seja apropriado, e um mínimo de três 
itens medidos por construto seja usado. Agora nos volta- 
mos a mudanças de especificação necessárias para a tran- 
sição de um modelo de mensuração para um estrutural. 


Modelagem das cargas de construto quando se testa a teo- 
ria estrutural. O modelo CFA na Figura 12-3a é modifi- 
cado para testar o modelo estrutural mostrado na parte de 
baixo. A parte de medida do modelo estrutural consiste 
das estimativas de cargas para os itens medidos e das esti- 
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mativas de correlação entre construtos exógenos. As esti- 
mativas de carga fatorial podem ser tratadas de diferentes 
maneiras no modelo estrutural. 

Um argumento sugere que, com o modelo CFA já es- 
timado neste ponto, as estimativas de carga fatorial são 
conhecidas. Portanto, seus valores devem ser fixados e 
especificados para as estimativas de cargas obtidas a par- 
tir do modelo CFA. Em outras palavras, eles não devem 
mais ser estimativas de parâmetros livres. Analogamente, 
como os termos de variância de erro são fornecidos a par- 
tir da CFA, seus valores também podem ser fixados, ao 
invés de estimados. 


A Figura 12-5 reproduz a CFA anterior e a correspon- 
dência com o modelo estrutural. Ela agora retrata as es- 
timativas de carga fatorial completamente padronizadas. 
Usando esta abordagem, as cargas seriam fixadas para 
os valores de CFA. Assim, as estimativas seriam trans- 
portadas para o modelo estrutural e os valores fixados 
(não estimados) quando o modelo estrutural é testado. 


(a) Modelo CFA 


O Apêndice 12B mostra um procedimento para fixação 
de cargas fatoriais para algum valor usando um progra- 
ma SEM. Este método é útil também se uma variável de 
um só item é incluída em um modelo SEM. 


É lógico fixar esses valores, uma vez que eles são co- 
nhecidos. No entanto, na medida em que qualquer um des- 
ses parâmetros são afetados pelas mudanças impostas ao 
se transformar o modelo CFA em um modelo estrutural, o 
ajuste é diminuído. Esta situação seria um exemplo de con- 
fusão de interpretação, que significa que as estimativas de 
medição para um construto estão sendo significativamen- 
te afetadas por relações diferentes daquelas entre essas 
medidas específicas. Colocando de outra forma, as cargas 
para qualquer construto dado não deveriam mudar apenas 
porque uma é feita mudança no modelo estrutural. Os pa- 
râmetros de medição deveriam ser estáveis. Uma vantagem 
deste método é que o modelo estrutural é mais fácil de se 
estimar porque muito mais parâmetros têm valores que são 
fixados. Uma desvantagem é que a mudança no ajuste entre 


(b) Modelo estrutural 


0,80 


Xa [0,70 


FIGURA 12-5 Estimativas de cargas de CFA em um modelo estrutural. 


* N. de R. T.: As notações corretas seriam “X,, X os Xp, Xi, My Xp Xi € NX. 
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a CFA e o modelo estrutural pode ser decorrente de pro- 
blemas com as medidas, e não da teoria estrutural. 

Outra abordagem é usar o padrão fatorial de CFA e per- 
mitir que os coeficientes para as cargas e os termos de variân- 
cia de erro sejam estimados juntamente com os coeficientes 
do modelo estrutural. Isso simplifica a transição de CFA para 
o estágio de teste estrutural pela eliminação da necessidade 
de experimentar o difícil processo de fixar todas as estimati- 
vas de cargas de construtos e de termos de variância de erro 
com os valores de CFA. O processo pode também revelar 
qualquer confusão de interpretação pela comparação das es- 
timativas de cargas de CFA com aquelas obtidas do modelo 
estrutural. Se as estimativas de cargas completamente padro- 
nizadas variam substancialmente, então existe evidência de 
confusão de interpretação. Pequenas flutuações são espe- 
radas (0,05 ou menos). Contudo, quando as inconsistências 
aumentam em tamanho e número, o pesquisador deve exa- 
minar as medidas mais atentamente. Outra vantagem desta 
abordagem é que o ajuste do modelo CFA original se torna 
uma base conveniente de comparação na avaliação do ajuste 
do modelo estrutural. Esta técnica é usada mais fregiiente- 
mente na prática e é a recomendada aqui. 


Medidas de um só item. Ocasionalmente um modelo es- 
trutural envolve uma medida de um único item. Ou seja, 
relações estruturais são teorizadas entre uma só variável 
e construtos latentes. A confiabilidade e a validade da 
medida de um só item não podem ser testadas usando-se 
CFA como medidas de múltiplos itens. Além disso, o coe- 
ficiente alfa (estimativa de confiabilidade) de uma medida 
de um só item não pode ser computado. A questão então 
passa a ser: “Como pode uma medida de um só item ser 
representada dentro de uma estrutura CFA/SEM? Como 
isso é especificado?”. Como suas características de men- 
suração são desconhecidas, passa a ser exigido o melhor 
julgamento do pesquisador para fixar o parâmetro de 
mensuração associado com o dado item. 


Um exemplo pode ajudar a esclarecer este processo. 
Frequentemente, pesquisadores de negócios estão in- 
teressados em estudar um resultado não-latente, como 
vendas. Por exemplo, uma companhia pode estar inte- 
ressada na investigação de numerosos fatores relativos 
à promoção e como eles estão induzindo vendas entre 
suas unidades comerciais. Assim, um modelo estrutural 
pode incluir construtos latentes como atitudes de clien- 
tes em relação à marca, percepções da clientela sobre 
preço e envolvimento de clientes. Esses construtos são 
usados para tentar modelar vendas com base em infor- 
mação de cada uma das unidades da empresa. Como re- 
gistros de vendas são mantidos eletronicamente, eles são 
relativamente livres de erros, mas não completamente. 
Formar um construto de item latente para vendas não é 
necessário, pois podemos medir esta variável diretamen- 
te com este único item. 


A variável de vendas seria então especificada como se 
fosse um construto endógeno com um único indicador. 
Assim, um caminho de mensuração os conecta. Este ca- 
minho de mensuração também inclui um termo de erro. 
O construto pode ser pensado como o verdadeiro escore 
de vendas, e a variável, como o escore de vendas obser- 
vado. Usando-se SEM, o verdadeiro escore resultará da 
correção da variável para qualquer erro de medição. Ca- 
minhos de mensuração e termos de variância de erro para 
construtos de um só item devem ser fixados com base no 
melhor conhecimento disponível. O pesquisador acredita 
que os registros de vendas são, em sua maioria, livres de 
erro. Assim, o pesquisador escolhe algum melhor valor 
estimado para confiabilidade. A relação entre a variável 
de vendas reais e o construto latente é então fixada na raiz 


REGRAS PRÁTICAS 12-1 


Especificação do modelo estrutural 


e CFA é limitada em sua habilidade de examinar 

a natureza de relações entre construtos além de 

correlações simples 

Um modelo estrutural deve ser testado depois que a 

CFA validou o modelo de mensuração 

As relações estruturais entre construtos podem ser 

criadas por: 

e Substituição de setas de dois sentidos de CFA por 
setas em um só sentido representando uma relação 
do tipo causa-e-efeito 
Remoção das setas curvadas de dois sentidos que 
conectam construtos que não são teorizados como 
diretamente relacionados 

Modelos recursivos SEM não podem ser associados 

com menos graus de liberdade do que um modelo CFA 

que envolve os mesmos construtos e variáveis 

Modelos não-recursivos que envolvem dados cross- 


section devem ser evitados na maioria dos casos: 

e É difícil produzir um conjunto de condições que 
possa sustentar um teste de uma relação recíproca 
com dados cross-section 


Modelos não-recursivos têm mais problemas com 
identificação estatística 
Quando um modelo estrutural está sendo especificado, 
ele deve usar o padrão de fator de CFA correspondente 
à teoria de mensuração e permitir que os coeficientes 
para as cargas e os termos de variância de erro sejam 
estimados juntamente com os coeficientes do modelo 
estrutural 
Caminhos de medição e termos de variância de erro 
para construtos de um só item devem ser fixados 
baseados no melhor conhecimento disponível 
e A estimativa de carga (relação à) entre a variável (y) 
e o construto latente (m) é fixada como sendo a raiz 
quadrada da melhor estimativa de sua confiabilidade 
* O correspondente termo de erro é fixado em 1 
menos a estimativa de confiabilidade 
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quadrada da confiabilidade estimada. O correspondente 
termo de erro é fixado em 1 menos a estimativa de confia- 
bilidade. Esta é uma técnica usada para lidar com medidas 
de um só item em SEM. 


Resumo 

Esta seção descreveu como mudar relações correlacio- 
nais entre construtos de CFA em relações de dependên- 
cia que correspondem a hipóteses de pesquisa em SEM. 
É como a teoria do pesquisador é representada. Tendo 
completado o estágio 5, agora avaliamos a validade desta 
teoria. 


Estágio 6: Avaliação da validade 
do modelo estrutural 


Compreensão do ajuste do modelo 

estrutural a partir de ajuste de CFA 

Este estágio avalia a validade do modelo estrutural. Os 
dados observados ainda são representados pela matriz de 
covariância da amostra observada. Uma matriz de cova- 
riância estimada também é computada. Em CFA, a matriz 
de covariância estimada é computada com base nas res- 
trições (padrão de estimativas paramétricas livres e fixa- 
das) correspondendo à teoria de mensuração. Enquanto a 
teoria estrutural for recursiva, ela não poderá incluir mais 
relações entre construtos do que o modelo CFA a partir 
do qual ela é desenvolvida. Portanto, a matriz de cova- 
riância estimada incluirá mais restrições, pois caminhos 
são fixados em O para todos aqueles entre construtos para 
os quais não existe qualquer motivo teórico para se espe- 
rar uma relação. Assim, um modelo estrutural recursivo 
não pode ter um valor x menor do que aquele obtido em 
CFA. 


Modelos teóricos saturados. Se o modelo SEM especi- 
fica um número de relações estruturais igual ao número 
de possíveis correlações de construtos em CFA, então 
ele é considerado um modelo estrutural saturado. Mode- 
los teóricos saturados não são geralmente interessantes, 
pois eles usualmente não podem revelar mais do que o 
modelo CFA. As estatísticas de ajuste para um modelo 
teórico saturado devem ser as mesmas obtidas para o mo- 
delo CFA, o que é algo útil de se saber. Uma maneira 
para pesquisadores poderem verificar se a transição de 
um modelo CFA para um modelo estrutural está correta 
é por meio do teste de um modelo estrutural saturado. Se 
seu ajuste não for igual ao do modelo CFA, algum erro 
foi cometido. 


Avaliação do ajuste geral do modelo estrutural. O 
ajuste do modelo estrutural é avaliado como foi com o 
modelo CFA. Logo, a boa prática dita que mais de uma 
estatística de ajuste seja empregada. Relembrando do 
Capítulo 10, recomendamos que sejam usados, no míni- 
mo, um índice de ajuste absoluto, um índice incremental 


e o x do modelo. Além disso, um dos índices deve ser de 
má qualidade de ajuste. Como antes, nenhum conjunto 
mágico de números sugere bom ajuste em todas as situa- 
ções. Mesmo um CFI igual a 1,0 e um x” insignificante 
podem não ter grande significado prático em um modelo 
simples. Portanto, são dadas apenas orientações gerais 
para diferentes situações. Aquelas orientações permane- 
cem as mesmas para a avaliação de ajuste de um modelo 
estrutural. 


Comparação do ajuste de CFA com o ajuste do modelo 
estrutural. O ajuste de CFA fornece uma base útil para 
avaliar o ajuste estrutural ou teórico. Um modelo estrutu- 
ral recursivo não pode se ajustar melhor (ter um x menor) 
do que a CFA geral; assim, pode-se concluir que a teoria 
estrutural carece de validade se o ajuste do modelo estru- 
tural for substancialmente pior do que o ajuste do modelo 
CFA [3]. Uma teoria estrutural procura explicar todas as 
relações entre construtos de maneira tão simples quanto 
possível. O modelo CFA padrão assume que existe uma 
relação em cada par de construtos. Apenas um modelo 
estrutural saturado faria esta suposição. Assim, modelos 
SEM tentam explicar relações entre construtos de modo 
mais simples e preciso do que CFA. Quando eles não con- 
seguem fazer isso, esta falha é refletida em estatísticas de 
ajuste relativamente ruins. Reciprocamente, um modelo 
estrutural que demonstra um valor Ax/ insignificante com 
seu modelo CFA é fortemente sugestivo de ajuste estru- 
tural adequado. 


Exame das relações de dependência teorizadas. Lembre 
que a avaliação de validade de modelo CFA não estava 
completa com base apenas em ajuste. Validade de cons- 
truto exige evidência adicional. Analogamente, bom ajus- 
te, por si só, é insuficiente para sustentar uma teoria estru- 
tural proposta. O pesquisador deve também examinar as 
estimativas individuais de parâmetros versus as previsões 
ou caminhos correspondentes, sendo que cada uma repre- 
senta uma hipótese específica. Assim, as estimativas de 
relações de dependência devem ser avaliadas. Validade 
de teoria aumenta na medida em que as estimativas de 
parâmetros são: 


e Estatisticamente significantes e no sentido previsto. Ou seja, 
elas são maiores do que zero para uma relação positiva e 
menores do que zero para uma relação negativa. 

e Não-triviais. Este aspecto pode ser verificado usando-se 
as estimativas de cargas completamente padronizadas. A 
orientação aqui é a mesma usada em outras técnicas mul- 
tivariadas. 


O pesquisador pode também examinar as estimativas 
de variância explicada para os construtos endógenos, as 
quais são essencialmente uma análise do R”. As mesmas 
diretrizes gerais se aplicam para tais valores, como se apli- 
caram com regressão múltipla. 

Bom ajuste não garante que o modelo SEM é a melhor 
representação dos dados. Como acontece com modelos 
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CFA, opções alternativas podem fregientemente produ- 
zir os mesmos resultados empíricos. Novamente, a teoria 
se torna essencial na avaliação da validade de um modelo 
estrutural. 


Exame do diagnóstico do modelo 

Os mesmos diagnósticos para modelos CFA são forneci- 
dos para SEM. Por exemplo, o padrão e o tamanho de 
resíduos padronizados podem ser usados para identificar 
problemas de ajuste. Podemos assumir que o modelo CFA 
tem validade suficiente se atingimos este estágio, e, assim, 
o foco é sobre a informação diagnóstica a respeito de re- 
lações entre construtos. Logo, o pesquisador prossegue 
como em modelos CFA. Mas atenção especial é dada para 
estimativas de caminhos, resíduos padronizados e índices 
de modificação associados com as possíveis relações entre 
construtos em qualquer uma das três formas (exógenos 
> endógenos, endógenos — endógenos, e covariância de 
erro entre construtos endógenos encontrados). Por exem- 
plo, se um problema com ajuste de modelo é devido a uma 
relação atualmente fixada entre um construto exógeno e 
um endógeno, ele provavelmente será revelado através 
de um resíduo padronizado ou de um elevado índice de 
modificação. 


Considere o modelo estrutural na Figura 12-5. O mo- 
delo não inclui um caminho conectando os constru- 
tos A e D. Se o modelo fosse testado e se realmente 
existisse uma relação entre esses dois construtos, um 
elevado resíduo padronizado ou um padrão de resí- 
duos provavelmente seriam encontrados entre itens 
que compõem esses dois construtos (x,-x, € ys-Ys, neste 
caso). Isto estaria nos dizendo que a covariância entre 
esses conjuntos de itens não foi reproduzida com pre- 
cisão por nossa teoria. Além disso, um elevado índice 
de modificação poderia existir para o caminho que se- 
ria rotulado como y,, (a relação de dependência de 
A para com D). Os índices de modificação para cami- 
nhos que não são estimados são mostrados na saída 
padrão de SEM. Pode-se pedir também que eles sejam 
exibidos em um diagrama de caminhos, usando-se os 
menus drop-down apropriados. Falando em termos 
gerais, diagnósticos de modelos são examinados da 
mesma maneira que se faz com modelos CFA. 


Um modelo deveria ser modificado com base nesta 
informação diagnóstica? É uma prática bastante comum 
conduzir análises post hoc que são posteriores ao teste da 
teoria. Análises post hoc são testes após-o-fato de rela- 
ções para as quais nenhuma hipótese foi feita. Em outros 
termos, um caminho é testado onde a teoria original não 
continha um caminho. Lembre que SEM fornece uma 
ferramenta excelente para teste de teoria. Portanto, qual- 
quer relação revelada em uma análise post hoc fornece 
somente evidência empírica, e não suporte teórico. Por 


esta razão, não se deve confiar em relações identificadas 
post hoc da mesma maneira que em relações teóricas ori- 
ginais. Análises estruturais post hoc são úteis apenas na 
especificação de potenciais melhoras no modelo que de- 
vem fazer sentido teórico e em termos de validação cru- 
zada, testando-se o modelo com novos dados obtidos da 
mesma população. Assim, análises post hoc não são úteis 
para teste de teoria, e qualquer tentativa neste sentido 
deve ser desencorajada. 


ILUSTRAÇÃO DE SEM 


As ilustrações de CFA no capítulo anterior começaram 
pelo teste de uma teoria de mensuração. O resultado 
final foi a validação de um conjunto de indicadores de 
construtos que permitem que a HBAT estude relações 
entre cinco importantes construtos. A HBAT gostaria 
de entender por que alguns empregados permanecem 
no emprego por mais tempo do que outros. Eles sabem 
que podem melhorar a qualidade dos serviços e a lucra- 
tividade quando empregados permanecem na empresa 
por mais tempo. O processo SEM de seis estágios co- 
meça com este objetivo em mente. Para esta ilustração, 
usamos o banco de dados HBAT SEM, disponível na 
Web em www.bookman.com.br. 


O modelo de mensuração completo foi testado no capí- 
tulo sobre CFA, mostrou-se que ele tem ajuste adequa- 
do e validade de construto. Lembre-se que as estatísticas 
de ajuste de CFA para este modelo foram: 


e X€ 229,95 com 179 graus de liberdade (0,05) 
e CFI=0,99 
e RMSEA = 0,027 


Para refrescar sua memória, os cinco construtos são 
definidos aqui: 


e Satisfação com o trabalho (JS). Reações resultantes da 
apreciação da situação de emprego de alguém. 

e Compromisso organizacional (OC). O grau em que um 
empregado se identifica com a HBAT, sentindo-se parte 
da empresa. 

e Intenções de permanência (SI). O grau em que um em- 
pregado pretende continuar trabalhando para a HBAT 
e não está participando de atividades que tornam o pe- 
dido de demissão algo mais provável. 

e Percepções ambientais (EP). Crenças que um emprega- 
do tem sobre as condições físicas de trabalho no dia-a- 
dia. 

e Atitudes com colegas (AC). Atitudes que um emprega- 
do tem com relação a colegas com os quais ele/ela inte- 
rage regularmente. 


A análise será conduzida no nível individual. A 
HBAT está agora pronta para testar o modelo estrutural 
usando SEM. 
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Estágio 5 de SEM: Especificação 
do modelo estrutural 


Com as medidas de construtos em mãos, os pesquisadores 
agora devem estabelecer as relações estruturais entre os 
construtos e traduzi-las para uma forma adequada para a 
análise SEM. As seções a seguir detalham a teoria estru- 
tural inerente à análise e ao diagrama de caminhos usado 
para a estimação das relações. 


Definição de uma teoria estrutural 

A equipe de pesquisa da HBAT propõe uma teoria ba- 
seada na literatura organizacional e na experiência co- 
letiva dos principais funcionários da administração da 
HBAT. Eles concordam que é impossível incluir todos os 
construtos que podem potencialmente se relacionar com a 
retenção de empregados (intenções de permanência). Isto 
seria muito dispendioso e trabalhoso para os responden- 
tes, com base no grande número de itens de pesquisa a 
serem completados. Assim, o estudo é conduzido com os 
cinco construtos previamente listados. 


A teoria leva a HBAT a esperar que EP, AC, JS e OC 
sejam todos relacionados com SI, mas de diferentes ma- 
neiras. Por exemplo, um elevado escore de EP significa 
que os empregados acreditam que seu ambiente de tra- 
balho é confortável e lhes permite conduzir livremente 
suas tarefas. Este ambiente é propício para criar elevada 
satisfação no emprego, o que, por sua vez, facilita uma 
ligação entre EP e SI. Como isso requer uma apresen- 
tação razoavelmente extensa de conceitos e descobertas 
organizacionais importantes, não desenvolveremos de- 
talhadamente a teoria aqui. 


A administração da HBAT quer testar as seguintes 
hipóteses: 


H,: Percepções ambientais são positivamente rela- 
cionadas com satisfação no trabalho. 

H,: Percepções ambientais são positivamente rela- 
cionadas com envolvimento organizacional. 

H,: Atitudes para com colegas são positivamente re- 
lacionadas com satisfação no emprego. 

H,: Atitudes para com colegas são positivamente re- 
lacionadas com envolvimento organizacional. 

H,: Satisfação no trabalho é positivamente relaciona- 
da com envolvimento organizacional. 

H,; Satisfação no trabalho é positivamente relaciona- 
da com intenções de permanência. 

H,: Envolvimento organizacional é positivamente re- 
lacionado com intenções de permanência. 


Diagrama visual 

A teoria pode ser expressa visualmente. A Figura 12-6 
mostra o diagrama correspondente a esta teoria. Para fins 
de simplificação, as variáveis indicadoras medidas e seus 
caminhos e erros correspondentes foram deixados de fora 
do diagrama. Se fossem usada uma interface gráfica com 
um programa SEM, então todas as variáveis medidas e os 
termos de variância de erro teriam que ser mostrados no 
diagrama de caminhos. 


Construtos exógenos. EPe AC são construtos exóge- 
nos neste modelo. Considera-se que eles são determina- 
dos por coisas fora deste modelo. Em termos práticos, 
isso significa que nenhuma hipótese prevê qualquer um 


(Continua) 


FIGURA 12-6 Modelo de retenção da empregados de HBAT. 


Hipótese Parâmetro 
HEEP O JS gy, 
H:EP +» OC 
H:AC +» JS Yi 
H:AC +» OC Jem 
H:JS +» OC po 
HiJS + SI Bo 
H:0C 5 Sl Boa 
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(Continuação) e 
desses construtos. Como ocorre com variáveis indepen- 


dentes em regressão, eles são usados apenas para prever 
outros construtos. 

Os dois construtos exógenos — EP e AC — são repre- 
sentados no extremo esquerdo. Nenhuma seta de um 
sentido aponta para os construtos exógenos. Uma seta 
curva de dois sentidos é incluída para capturar qualquer 
covariância entre esses dois construtos (q, ,). Apesar de 
nenhuma hipótese conectá-los, eles podem não ser cons- 
trutos independentes. Assim, se o modelo de mensura- 
ção estima um coeficiente de caminho entre construtos 
não envolvidos em qualquer hipótese, então tal parâme- 
tro também deve ser estimado no modelo SEM. 


Construtos endógenos. JS, OC e SI são endógenos 
neste modelo. Cada um é determinado por construtos 
incluídos no modelo e, assim, cada um também é vis- 
to como um resultado baseado nas hipóteses listadas. 
Observe que JS e OC são usados como resultados em 
algumas hipóteses e como preditores em outras. Este 
papel dual é perfeitamente aceitável em SEM, e um 
teste para todas as hipóteses pode ser fornecido com 
um teste de modelo estrutural. Este tipo de teste de 
hipótese não seria possível com um único modelo de 
regressão, pois estaríamos limitados a uma só variável 
dependente. 

O modelo de caminhos estruturais começa a se de- 
senvolver a partir dos construtos exógenos. Um caminho 
deveria conectar quaisquer dois construtos teoricamen- 
te ligados por uma hipótese. Portanto, depois de esbo- 
çar os três construtos endógenos (JS, OC e ST), setas de 
um só sentido são colocadas conectando os construtos 
preditores (exógenos) com seus respectivos resultados, 
com base nas hipóteses. A legenda no canto inferior di- 
reito da Figura 12-6 lista cada hipótese e o caminho ao 
qual pertence. Cada seta de um sentido representa um 
caminho direto e é rotulada com a estimativa paramétri- 
ca apropriada. Por exemplo, H, se refere a uma relação 
positiva EP-OC. Uma estimativa paramétrica conectan- 
do um construto exógeno a um endógeno é designada 
pelo símbolo (y). A convenção é que o primeiro subs- 
crito lista o número do construto para o qual o caminho 
aponta, e o segundo subscrito se refere ao construto no 
qual o caminho começa. Assim, H, é representada por 
Y,: Analogamente então, H,, que conecta SI com OC, é 
representada por B,,. 


Os caminhos supostos devem ser comunicados a um 
programa SEM a fim de se obter resultados. O Apêndice 
12D fornece a sintaxe do programa SEM (LISREL) que 
produz resultados para este modelo. Com AMOS você 
deve esboçar o modelo usando a interface gráfica, iden- 


tificar os dados adequados para uso, e então processar o 
modelo. 


Estágio 6: Avaliação da validade 
do modelo estrutural 


O modelo estrutural mostrado no diagrama de caminhos 
pode agora ser estimado. O ajuste do modelo SEM e a 
consistência das relações com expectativas teóricas po- 
dem ser avaliados. Agora nos voltamos a um resumo do 
resultado do modelo exibido na Figura 12-7. 


Primeiramente examinamos as estimativas de cargas 
para garantir que elas não mudaram substancialmente 
em relação ao modelo CFA. Neste caso, as estimati- 
vas de cargas são virtualmente inalteradas em relação 
aos resultados de CFA. Somente três cargas estimadas 
completamente padronizadas mudam, e a mudança 
máxima é de 0,01. Assim, se já não tivesse sido testa- 
da no estágio CFA, a evidência agora indica estabili- 
dade paramétrica entre os itens medidos. Em termos 
técnicos, nenhum problema decorre de confusão de 
interpretação, o que sustenta ainda mais a validade do 
modelo de mensuração. 

A seguir, o ajuste geral do modelo é examinado. A 
saída de SEM na Figura 12-7 mostra as estatísticas de 
ajuste geral resultantes do teste do modelo. O x” é 275,1 
com 181 graus de liberdade (p < 0,05). O CFI do modelo 
é o mesmo de CFA em 0,99. A RMSEA é 0,036, que é 
0,009 maior do que em CFA. O intervalo de confiança de 
90% para RMSEA é de 0,027 a 0,045. A RMSEA ainda 
está dentro de um intervalo que pode ser associado com 
bom ajuste. Esses diagnósticos sugerem que o modelo 
fornece um bom ajuste geral (ver Capítulo 10 para uma 
revisão sobre diretrizes de ajuste). 


A validação do modelo não está completa sem o exa- 
me das estimativas paramétricas individuais. Elas são es- 
tatisticamente significantes, estão na direção prevista, são 
não-triviais? Todas essas respostas devem ser dadas para- 
lelamente à avaliação do ajuste do modelo. 


A Figura 12-8 mostra o diagrama de caminhos com 
as estimativas paramétricas estruturais resultantes com- 
pletamente padronizadas incluídas nos caminhos. Além 
disso, a seguinte saída padrão é gerada pelo programa 
SEM e contém as estimativas estruturais de máxima ve- 
rossimilhança (ML), erros padrão e valores-t. Observe 
que essas são estimativas de máxima verossimilhança em 
uma primeira aproximação e, assim, elas diferem daque- 
las mostradas na Figura 12-8. 
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Estatística de qualidade de ajuste 


Graus de liberdade = 181 


Função qui-quadrado de ajuste mínimo = 275,1 (P = 0,00) 


Parâmetro estimado de não-centralidade (NCP) = 
Intervalo de 90% de confiança para NCP = (53,33; 


Raiz do erro quadrático médio de aproximação (RMSEA) 
Intervalo de 90% de confiança para RMSEA = (0,027; 
Valor-p para teste de ajuste próximo (RMSEA < 0,05) 


índice de validação cruzada esperado (ECVI) = 0,94 


Intervalo de 90% de confiança para ECVI = (0,84; 
ECVI para modelo saturado = 1,16 
ECVI para modelo de independência = 20,28 


0,036 


0,045) 
1,00 


Qui-quadrado para modelo de independência com 210 graus de liberdade = 8030,24 


AIC de independência = 8072,24 


AIC do modelo = 375,09 

AIC saturado = 462,00 

índice de ajuste normado (NFI) = 0,96 

índice de ajuste não-normado (NNFI) = 0,98 

Índice de ajuste normado de parcimônia (PNFI) = 0,83 
índice de ajuste comparativo (CFI) = 0,99 

Índice de ajuste incremental (IFI) = 0,99 

índice de ajuste relativo (RFI) = 0,96 

N crítico (CN) = 321,42 

Raiz do resíduo quadrático médio (RMR) = 0,11 

RMR padronizado = 0,060 

Índice de qualidade de ajuste (GFI) = 0,94 

Índice de qualidade de ajuste ajustado (AGFI) = 0,92 


FIGURA 12-7 Ajuste do modelo geral de retenção de empregados da HBAT. 


ESTIMATIVAS DE MÁXIMA VEROSSIMILHANÇA 
PARA BETA (B) 
(Não-padronizadas) 


SI 0,09 
(Banli=="""t0,04) (0,03) 
2,38 8,26 
GAMA (y) 
Ra EP AC 
Jus = 0,20 -0,01 1 
(0,05) (0,05) 
4,02 -0,17 


SI - = - = 


esa JS RSS, acasesdo 

oc 0,13 -- -- 
(0,08) 
1,60 


Aqui os resultados são separados em grupos com 
base no tipo de relação que eles representam. Novamen- 
te, LISREL faz esse agrupamento por modo padrão. 
AMOS não agrupa relações por tipo desta maneira. 
Tanto AMOS quanto LISREL mostram os resultados 
de máxima verossimilhança como padrão. 

Todas as estimativas de caminhos estruturais são 
significantes e na direção esperada, exceto duas. As 
exceções são as estimativas entre AC e JS (y,,) e entre 
JS e OC (B,,). y,, tem uma estimativa de ML de —0,01 
e um valor-t de —0,17. B,, tem uma estimativa de ML 
de 0,13 com um valor-t de 1,60, o que fica abaixo do 
valor-t crítico para um erro Tipo I de 0,05. Logo, ape- 
sar de a estimativa estar na direção suposta, ela não é 
sustentada. No geral, porém, uma vez que cinco das 
sete estimativas são consistentes com as hipóteses, es- 
ses resultados sustentam o modelo teórico com uma 
advertência para os dois caminhos que não são susten- 
tados. 


Exame do diagnóstico de modelo 

Como discutido anteriormente, diversas medidas diag- 
nósticas estão disponíveis para o pesquisador, variando 
de índices de ajuste a resíduos padronizados e índices de 
modificação. Cada uma delas é examinada na discussão a 
seguir para nos certificarmos se vale a pena considerar re- 
especificação do modelo. 
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Hipótese Parâmetro Sustentada? 
H: EP» JS ya Sim 
ERES OC Sim 
Ha: AC pp JS ya Não 
H: AC 5 OC yo Sim 
H: JS +» OC B Não 
Ino dS de SB Sim 
H: OC » Sl Bão Sim 


FIGURA 12-8 Estimativas de caminhos completamente padronizadas para o modelo estrutural da HBAT. 


As outras estatísticas de ajuste, em geral, também 
sustentam o modelo. Por exemplo, a SRMR aumentou 
de 0,035 para 0,060, mas ainda é um valor associado 
com bom ajuste. Como teste complementar, a HBAT 
examina a diferença de ajuste entre o modelo estrutu- 
rale o de CFA. O Ay resultante é de 45,2 com dois 
graus de liberdade (p < 0,001). Ele pode ser determina- 
do pelo cálculo da diferença entre os valores de x” de 
SEM e de CFA. A diferença em graus de liberdade é 
2,0 que é devido ao fato de que todos os caminhos es- 
truturais possíveis são estimados, exceto dois. Essa di- 
ferença altamente significante sugere que o ajuste pode 
ser melhorado estimando-se outro caminho estrutural. 
A possibilidade de outro caminho estrutural significa- 
tivo deve ser considerada, particularmente se outra in- 
formação diagnóstica aponta especificamente para uma 
relação em particular. 

O programa SEM oferece um resumo dos resídu- 
os padronizados em uma matriz que mostra o resíduo 
padronizado para cada variável medida. Esta última é 
fornecida porque a pedimos como uma opção. Uma par- 
te do resumo é listada a seguir, na qual este resíduo em 
particular é apresentado: 


Menor resíduo padronizado = -2,99 
Resíduo padronizado mediano = 0,00 


Maior resíduo padronizado = 5,84 


Maiores resíduos padronizados negativos 


Resíduo para SI2 e oc1 -2,90 
Resíduo para SI3 e oc1 -2,88 
Resíduo para SI4 e oc1 -2,99 
Resíduo para EP3 e oc1 -2,90 


Maiores resíduos padronizados positivos 
Resíduo para SI2 e sI1 3,45 
Resíduo para SI4 e SI3 3,47 


Maior 
resíduo 
padroni- 
zado 


Maior resíduo padronizado 
Resíduo para EP1 e sI1 3,78 
Resíduo para EP2 e SI4 5,84 


Uma análise dos resíduos padronizados para o mo- 
delo sugere que o resíduo máximo é para a covariância 
entre as variáveis medidas EP2 e SI4. Seu valor é 5,84, o 
que indica um problema em potencial, pois excede 4. A 
relação estrutural correspondente a este resíduo seria um 
caminho direto de EP a SI. No momento, a relação entre 
esses dois construtos é explicada somente pelas relações 
sequenciais EP > JS > SIe EP 5 JS 5 0€C 5 SI Ne- 
nhuma seta liga EP (um construto exógeno, &,) e SI (um 
construto endógeno, m;) diretamente. Como resultado, o 
pesquisador verifica os índices de modificação. Aqui, os 
índices de modificação são agrupados pelo tipo de pará- 
metro que eles indicam. LISREL fornece saída neste for- 
mato. AMOS simplesmente lista os índices de modifica- 
ção para parâmetros estruturais sem fazer esta distinção. 


Índices de modificação para GAMA (y) 


EP AC 
Js Epa Eae 
oc Ey jm = e Y31 
SI 40,12 8,98 


O maior índice de modificação é para EP > SI (y,1), 
o que corresponde a uma seta de EP a SI (ver Figura 
12-9). Esta relação não foi anteriormente incluída no 
modelo estrutural da Figura 12-8 porque não é parte da 
teoria da HBAT. Seu valor, 40,12, levanta dúvida sobre 
a premissa de que JS media a relação entre EP e SI. 


CAPÍTULO 12 SEM: Teste de um Modelo Estrutural 659 


Reespecificação de modelo 

Muitas vezes, as medidas diagnósticas disponíveis em 
SEM indicam uma potencial reespecificação do modelo. 
Apesar de já termos discutido sobre o fato de que qual- 
quer reespecificação tem necessidade crítica de suporte 
tanto teórico quanto empírico, a reespecificação de mo- 
delo pode melhorar o ajuste do modelo. A discussão a 
seguir detalha uma reespecificação em nosso exemplo 
da HBAT. 


Como resultado, a HBAT reestima o modelo usando 
uma análise post hoc adicionando o caminho sugerido. 
A Figura 12-9 descreve o modelo, incluindo um caminho 
livre correspondente a esta relação direta. O programa 
SEM é instruído a liberar EP > SI (y;,). A estimativa 
paramétrica completamente padronizada resultante 
para y;, é de 0,37 com um valor-t de 6,12 (p < 0,001). 
Além disso, o ajuste geral revela um valor x de 238,85 
com 180 graus de liberdade. O CFI continua em 0,99 e a 
RMSEA é 0,029, o que é praticamente o mesmo valor 
do modelo CFA. Este ajuste é melhor do que no mo- 
delo estrutural original, pois Ax'= 36,2 e com 1 grau de 
liberdade, o que é significante (p < 0,001). Diversas es- 
timativas de caminhos do modelo original mudaram um 
pouco, como esperado. Mais notavelmente, a relação JS 
> SI (B,, = 0,06) não é mais significante, e a relação SI 
— OC* (B,, = 0,36) continua significante, apesar de ser 
substancialmente menor do que antes. 

O valor de Ax entre os modelos SEM revisado e 
CFA é 8,90 com 1 grau de liberdade. A correlação múl- 
tipla quadrática (ou seja, R?) para SI também melhora 
de 0,35 para 0,45 com o acréscimo desta relação. Tais 
descobertas têm implicações para os tipos de relações 
que conectam esses construtos, como percebemos na 
próxima seção. 


Resumo 

Até este momento, a HBAT testou seu modelo estrutu- 
ral original. Os resultados mostraram ajuste geral razoa- 
velmente bom e as relações teorizadas foram, em geral, 
sustentadas. Contudo, a grande diferença de ajuste entre 
o modelo estrutural e o CFA, bem como diversos diag- 
nósticos estratégicos, incluindo os resíduos padronizados, 
sugeriram um melhoramento no modelo. Esta mudança 
melhorou o ajuste do modelo. Agora, a HBAT deve con- 
siderar o teste deste modelo com novos dados para avaliar 
sua generalidade. 


TÓPICOS AVANÇADOS 


O processo SEM de seis estágios foi discutido neste capí- 
tulo e no anterior. Agora, diversos tópicos avançados são 
discutidos, os quais descrevem diferentes tipos de relações 
estruturais, bem como análises multigrupos para modelos 
estruturais. 


Tipos de relação 


Relações podem ser caracterizadas de muitas maneiras. 
No Capítulo 10, descrevemos relações em modelos SEM. 
Agora explicamos os tipos de relações que compõem o 
modelo estrutural. 

Uma relação de regressão tipicamente implica uma 
associação simples ou uma relação causal. SEM permite 
que pesquisadores examinem relações entre variáveis de 
uma maneira que muitas outras técnicas não fazem. Me- 
diação e moderação são dois dos tipos mais comuns de 
relações. 


Mediação 
Um efeito mediador é criado quando uma terceira variá- 
vel/construto intervém entre dois outros construtos rela- 


FIGURA 12-9 Estimativas de caminhos completamente padronizadas para o modelo estrutural revisado da HBAT. 


* N.de R.T.: A notação correta seria “OC > SP”. 
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cionados entre si. O diagrama a seguir ilustra um efeito 
mediador: 


O construto M media a relação entre K e E. Media- 
ção requer correlações significantes entre todos os três 
construtos. Teoricamente, um construto mediador facili- 
ta a relação entre os outros dois construtos envolvidos. O 
exemplo a seguir ilustra esses pontos: 


K pode ser a inteligência de um estudante, E, o desem- 
penho da turma, e M, a efetividade do estudo. Logo, um 
estudante pode ser inteligente, mas nem sempre ter bom 
desempenho. Se um estudante é inteligente, esta quali- 
dade pode encorajá-lo a estudar mais e melhor, o que 
pode resultar em um melhor desempenho da turma. Em 
tal caso, a correlação significante entre K e E seria expli- 
cada pela seqiiência K-M-E de relações. O coeficiente 
paramétrico resultante para c seria 0 no caso de media- 
ção completa. 


Um pesquisador pode examinar mediação de várias 
maneiras. Primeiro, se é esperado que o caminho rotula- 
do por c seja O devido à mediação, um modelo SEM pode 
representar essa relação. Este modelo incluiria apenas os 
caminhos rotulados por a e b, com mostrado no diagrama 
a seguir: 


E dá 


Ele não incluiria um caminho diretamente de K a E. 
Se o modelo sugere que a sequência K-M-E fornece um 
bom ajuste, ele sustenta um papel mediador para M. Além 
disso, o ajuste deste modelo pode ser comparado com os 
resultados SEM de um modelo incluindo o caminho K-E 
(c). Se a adição do caminho c melhora significativamente 
o ajuste como indicado por Ax, então mediação não é sus- 
tentada. Se os dois modelos produzem ajustes semelhan- 
tes, então mediação é sustentada. 

Como relações nem sempre são claras, uma série de 
passos pode ser seguida para avaliar mediação. Esses pas- 
sos se explicam usando-se tanto SEM quanto qualquer 
outra abordagem de modelo linear geral (GLM), incluin- 
do análise de regressão múltipla. Usando-se o diagrama 
da mediação anterior, os passos são [7]: 


1. Verificar para saber que: 
a. Kse relaciona com E (correlação significante). 
b. K se relaciona com M (correlação significante). 
c. Mse relaciona com E (correlação significante). 
2. Sec,a relação entre K e E, continua significante e inalterada 
quando M é incluído no modelo como preditor adicional (K 
e M agora prevêem E), então mediação não é sustentada. 
3. Se c é reduzida mas se mantém significante quando M é in- 
cluído como preditor adicional, então mediação parcial é 
sustentada. 
4. Se c é reduzida a um ponto no qual não é significantemente 
diferente de zero depois que M é incluído como construto 
mediador, então mediação completa é sustentada. 


Retornamos a um de nossos exemplos anteriores para 
verificarmos como este processo pode ser aplicado. 


No diagrama da Figura 12-3b, o construto C é tido como 
mediador da relação entre os construtos A e D. Ana- 
logamente, o construto C é suposto como mediador na 
relação entre os construtos B e D. Se o ajuste deste mo- 
delo for aceitável, ele sustenta o papel de C como media- 
dor. No entanto, o pesquisador pode testar para ver se A 
ou B se relacionam diretamente com D. Quaisquer rela- 
ções diretas entre A e D ou B e D indicam que mediação 
completa não é sustentada. Quando as estimativas de ca- 
minhos para A-D e B-D não são significantes, e os outros 
caminhos são significantes, então os papéis mediadores 
teorizados do construto C encontram sustentação. 


Efeitos indiretos. Um modelo estrutural com um efeito 
mediador suposto pode produzir efeitos diretos e indi- 
retos. Efeitos diretos são as relações que conectam dois 
construtos com uma só seta. Efeitos indiretos são aquelas 
relações que envolvem uma segiiência de relações com 
pelo menos um construto intermediário. Assim, um efeito 
indireto é uma sequência de dois ou mais efeitos diretos 
e é visualmente representado por múltiplas setas. Efeitos 
indiretos são consistentes com mediação. O diagrama a 
seguir mostra um efeito indireto de K sobre E na forma 
de uma segiênciaK >M 5 E. 


K E [M É SE 


Um efeito direto de K e E incluiria uma única seta. 


A Figura 12-10 reproduz o modelo estrutural mostra- 
do na Figura 12-3 com duas modificações. Primeiro, ela 


agora inclui uma relação teorizada entre os construtos 
(Continua) 
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FIGURA 12-10 Um modelo SEM com efeitos indiretos. 


(Continuação) 
B e D. Segundo, suponha que o modelo foi estimado 
usando SEM e as estimativas de caminhos estruturais 
são mostradas. O modelo inclui efeitos diretos para os 
seguintes caminhos: 


ASC=0,50 
B>5 C=0,50 
B>5D=0,30 
C5D=0,40 


O tamanho de um efeito indireto é uma função dos 
efeitos diretos que o formam. O programa SEM tipica- 
mente produz uma tabela que mostra o tamanho dos efei- 
tos diretos implicados por um modelo. Eles podem ser 
computados também multiplicando-se os efeitos diretos 
entre si. 


Por exemplo, supõe-se que A afeta D indiretamente por 
meio de C. O tamanho deste efeito indireto pode ser cal- 
culado multiplicando-se 0,50, a relação estimada de A a €, 
por 0,40, a relação estimada de C a D. O resultado é 0,20. 
Os efeitos indiretos para o modelo na Figura 12-10 são: 
ASCS5DOS0 x 0,40 = 0,20 
B5 C5DO,50 x 0,40 = 0,20 


O efeito total de um construto sobre outro é a soma 
das relações indiretas e diretas entre eles. 


Por exemplo, o efeito total de B sobre D é: 
0,30 (direto) + 0,20 (indireto) = 0,50 


Apesar de sequências de três variáveis serem exibidas 
aqui, duas ou mais variáveis podem intermediar na rela- 
ção entre um construto e o resultado subsegiiente. A ilus- 
tração da HBAT oferece um exemplo de um modelo que 
resulta em diversas relações mediadas. 


Ilustração HBAT de mediação. O modelo HBAT mos- 
trado na Figura 12-8 teoriza diversos efeitos mediadores. 


Assim, os resultados do modelo original podem ser com- 
parados com um modelo revisado, para que se examine a 
extensão da mediação. 


O diagnóstico para o modelo original HBAT SEM su- 
gere um caminho direto de EP para SI (y;,). O modelo 
revisado mostrado na Figura 12-9 inclui tal relação direta. 
Quando esta relação direta foi incluída, várias outras esti- 
mativas de caminhos mudaram. O modelo original supôs 
que qualquer efeito de EP sobre SI seria mediado por JS 
e/ou OC por meio da seqiiência de relações que conectam 
EP com SI. Assim, o diagnóstico que levou ao teste de 
um modelo revisado acabou levantando a questão sobre 
a natureza teorizada de mediação completa da conexão 
entre EP e SI. Em outras palavras, o tipo de relação é 
questionado. 

Os resultados sugerem um caminho direto entre 
EP e SI, pois a estimativa do caminho é significante e 
o acréscimo do caminho melhora o ajuste do modelo. 
Com um caminho direto significante, a relação JS-SI se 
torna insignificante; JS não media a relação entre EP e 
SI, como originalmente suposto. Logo, é provável que o 
tipo de relação seja direto, e não indireto. Em retrospec- 
to, a relação direta pode fazer sentido, pois além de fazer 
as pessoas se sentirem satisfeitas, os empregados ficam 
mais familiarizados com seus ambientes de trabalho e 
podem achar desagradável a idéia de trabalhar em um 
ambiente com o qual não tenham familiaridade. O con- 
forto relativo com o ambiente familiar de trabalho pode 
fazer com que seja mais provável que os empregados fi- 
quem. Dada esta análise teórica post hoc, a HBAT pre- 
cisa promover a validação cruzada deste resultado com 
novos dados antes de considerá-la confiável. Contudo, 
implicações administrativas para cada uma das hipóteses 
sustentadas podem ser desenvolvidas com base nos re- 
sultados positivos gerais. 

Para fins de ilustração, um resumo das relações dire- 
tas e indiretas (mediadas) é mostrado aqui: 


(Continua) 
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(Continuação) 
Direta: =EPS5SI 0,37 
Indireta EPS5 JS 5 SI 0,24 x 0,06 = 0,014 
Indireta EP > JS > 0€ 5 SI 0,24 x 0,10 x 0,36 = 0,0086 
Total 0,37 + 0,014 + 0,0086 = 0,39 


Este resultado ilustra que EP e SI são conectados 
diretamente, e não indiretamente. O tamanho de cada 
efeito indireto é irrelevante relativamente à força do 
efeito direto. Adicioná-los ao efeito direto deixa-o vir- 
tualmente inalterado. Neste caso, cada efeito indireto 
inclui também pelo menos uma relação insignificante. 
Ffeitos indiretos pequenos (ou seja, menores do que 
0,08) raramente são de interesse e dificilmente acrescen- 
tam algo às conclusões substanciais. Nesta ilustração da 
HBAT, a relação indireta EP-SI não seria interpretada. 


Moderação 

Um efeito moderador ocorre quando uma terceira variá- 
vel ou construto muda a relação entre duas variáveis/cons- 
trutos relacionadas. Um moderador significa que a relação 
entre duas variáveis muda com o nível de outra variável/ 
construto. A interpretação de moderadores é mais difícil, 
pois um moderador fica mais fortemente relacionado com 
alguma das demais variáveis/construtos envolvidas na aná- 
lise. Logo, a análise de moderadores é mais fácil quando o 
moderador não apresenta relação linear significante com 
o preditor ou a variável de critério (construto resultante) 
[5, 7,10]. A falta de uma relação entre o moderador e as 
variáveis preditoras e de critério ajuda a distinguir mode- 
radores de mediadores. Isso facilita também na interpreta- 
ção, uma vez que multicolinearidade elevada, como o caso 
em que o moderador é altamente relacionado com o predi- 
tor ou o critério, torna difícil uma interpretação válida. 


Moderadores não-métricos. Uma variável moderadora 
pode ser métrica ou não-métrica. Variáveis categóricas 
não-métricas frequentemente são teorizadas como mo- 
deradoras. Elas tipicamente são variáveis de classificação 
de algum tipo. Por exemplo, com frequência sexo é usado 
como moderador. Analogamente, cultura pode se mos- 
trar um importante moderador. Se um pesquisador está 
examinando o efeito de um anúncio em inglês em uma 
comunidade bilíngiie (como francês e inglês), espera-se 
que a força de uma relação entre exposição ao anúncio e 
efetividade do mesmo seja maior entre os respondentes 
de origem inglesa do que entre os de origem francesa. 

Teoria é importante na avaliação de um moderador, 
pois um pesquisador deveria ter alguma razão para espe- 
rar que o moderador mudasse uma relação. No exemplo 
precedente é razoável esperar que maior exposição ao 
anúncio terá maior efeito sobre consumidores que o com- 
preendem melhor. Em suma, indivíduos com maior pro- 
ficiência no idioma compreendem melhor a mensagem e 
provavelmente responderão a ela. Caso contrário, é um 
anúncio ruim! 


Uso de SEM de múltiplos grupos para testar mode- 
ração. SEM de multigrupos é frequentemente usada 
para testar efeitos moderadores. Por exemplo, considere 
que o construto C na Figura 12-3b é quantia de anúncio e 
o construto D é efetividade do anúncio. Um modelo SEM 
multigrupo é conduzido como descrito no capítulo ante- 
rior para CFA de múltiplos grupos. Os procedimentos 
que são utilizados para testar moderação desta maneira 
seguem de modo muito próximo os testes de invariância 
executados em CFA. Ou seja, a mesma estrutura de mo- 
delo SEM é usada com ambos os grupos. Os dois grupos 
representam duas culturas diferentes: os que falam inglês 
e os que falam francês. 


Inicialmente, o modelo de dois grupos seria testado per- 
mitindo que todas as relações teorizadas, incluindo B,, 
(relação entre C e D), fossem livremente estimadas em 
ambos os grupos. Este modelo seria o equivalente estru- 
tural do modelo CFA TF. A seguir, um segundo modelo 
é testado adicionando-se uma restrição que fixa a rela- 
ção entre C e D como sendo igual entre os dois grupos. 
O resultado é que a relação entre C e D assumiria o mes- 
mo valor nas amostras de inglês e francês. 

Esta restrição afeta negativamente o ajuste do mo- 
delo? O efeito sobre ajuste pode ser estimado via Ax.. 
Se for significante, então a restrição de igualar a relação 
nos dois grupos prejudicou o ajuste do modelo. Portan- 
to, moderação seria sustentada. Em outras palavras, o 
modelo tem melhor ajuste quando se permite que a re- 
lação seja diferente com base na variável moderadora 
(cultura, neste caso). 

Se a relação entre C e D for maior nos dados de in- 
glês do que nos dados de francês, então o teste de mo- 
deração está completo e ela é suportada. Se a restrição 
de igualdade não prejudicar o ajuste (Axº insignificante), 
então moderação não encontra apoio e a conclusão lógi- 
ca é que a relação exposição ao anúncio — efetividade 
do anúncio é a mesma entre consumidores que falam in- 
glês e aqueles que falam francês. 


Moderadores métricos. Um moderador pode também 
ser métrico e ser avaliado usando-se SEM. Se a variável 
contínua puder ser categorizada de uma maneira que 
faça sentido, então grupos podem ser criados e os mes- 
mos procedimentos anteriormente descritos podem ser 
usados para testar moderação, mas somente se grupos 
lógicos puderem ser justificados. Por exemplo, se a variá- 
vel contínua mostra bimodalidade (isto é, a distribuição 
de freqiiência mostra claramente dois picos no lugar de 
um), então grupos lógicos podem ser criados em torno de 
cada moda. Análise de agrupamentos ou MDA também 
podem ser úteis para formar grupos. Por outro lado, se 
a variável moderadora retrata uma distribuição unimodal 
(um pico), agrupamento não se justifica. É possível que 
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alguma fração (como 1/3) das observações em torno do 
valor mediano possam ser eliminadas e as restantes (que 
agora provavelmente são bimodais) sejam usadas para 
criar grupos. Uma desvantagem óbvia desta abordagem é 
o aumento de custo, tempo e esforço associado com a ne- 
cessidade se juntar uma amostra maior. A vantagem é que 
a análise multigrupo representa uma maneira intuitiva de 
mostrar moderação. 

O pesquisador pode também modelar uma interação 
contínua criando termos de interação, como se faz quan- 
do se usa uma técnica de regressão. Usando terminologia 
de regressão, a variável independente pode ser multiplica- 
da pelo moderador para criar um termo de interação. Não 
obstante, seguir esta abordagem com construtos de múl- 
tiplos itens é complicado por numerosos fatores. Logo, 
consideramos este tópico bastante avançado. Segue uma 
breve introdução, mas encorajamos todos os usuários, ex- 
ceto os experientes, a aplicarem a abordagem de múltiplos 
grupos, a menos que isso não possa ser justificado. 


Interações de variáveis contínuas. Outra técnica 
para lidar com um moderador contínuo é criar uma in- 
teração entre o moderador e o preditor. Interações entre 
variáveis individuais foram tratadas em capítulos ante- 
riores e, assim, nos concentramos aqui em um construto 
moderador que seria medido por múltiplos indicadores. 
A Figura 12-11 ilustra uma maneira para lidar com intera- 
ções de variáveis contínuas. Considere um modelo SEM 
com dois construtos exógenos prevendo um único cons- 
truto endógeno. Cada construto é indicado por quatro 
itens medidos. Se o primeiro construto (E,) é teorizado 
como preditor e o segundo (&,) é assumido como sendo 
um moderador, então um construto de interação pode ser 
criado para representar o efeito moderador pela multipli- 
cação dos indicadores dos construtos preditor e modera- 
dor juntos. Usando-se esta linha de raciocínio, os indica- 
dores para o terceiro construto de interação (&;,) podem 
ser computados como se segue: 

Kj = Ms 
Xy =X, XX 
X%y =X XX 
X =X, XX 


Essas variáveis computadas podem então ser acrescen- 
tadas aos dados reais que contêm 12 variáveis medidas e os 
termos de covariância entre essas variáveis calculadas e as 
demais que podem ser computadas. Agora, a matriz de co- 
variância para este modelo mudaria de 12 x 12 para 16 x 16. 

A estimação deste modelo é complicada por diversos 
fatores [15]. Tais fatores incluem o fato de que a suposição 
de não-correlação entre termos de erro não é mais plau- 
sível, pois as cargas para o terceiro construto (E,) são uma 
função matemática daquelas para os construtos 1 e 2 (É, 
e é). Este fato leva a uma configuração muito complexa 
do modelo SEM que é recomendada somente para usuá- 
rios avançados. Assim, aqui descrevemos apenas tal téc- 


nica brevemente. Esta configuração requer que os termos 
de intercepto para os itens medidos (r,) sejam estimados 
como descrito no Capítulo 11. O padrão de cargas fato- 
riais exógenas não pode mais exibir uma estrutura sim- 
ples. Ainda que as estimativas de cargas para o terceiro 
construto possam ser computadas pela multiplicação das 
estimativas de cargas correspondentes às variáveis que 
criaram cada indicador de interação, cargas cruzadas en- 
tre construtos também existem para o termo de interação. 
Elas são calculadas cruzando-se os termos 7, com as res- 
pectivas estimativas de cargas. Novamente, este processo 
é muito complicado de se seguir, mas, como exemplo, a 
12º linha de A, ficaria da seguinte maneira: 


A, As AA] 


Além disso, a matriz de variância-covariância de 
erro para as variáveis x (0,) devem agora incluir termos 
para os itens apropriados de covariância de erro, que 
existem devido à natureza computacional do construto 
intercepto. Esses itens não precisam ser estimados, pois 
eles são matematicamente determinados como o termo 
intercepto para o item medido utilizado para computar 
o indicador de interação vezes a variância de erro para 
um construto. Este conceito é mais facilmente ilustrado 
por um exemplo. O parâmetro 5, é o termo de variância 
de erro para x,, O primeiro indicador para o construto 
moderador. Uma vez que ele é computado como x, ve- 
zes xs, um termo de covariância de erro faz-se necessário 
para ambos 0,9, € 0595: Os valores seriam fixados como 7, 
vezes 0,11 € T5 Vezes 0,55, respectivamente. 

Depois de se terminar uma configuração seguindo es- 
sas orientações, o modelo pode ser estimado especifican- 
do-se apenas o caminho estrutural entre o construto de 
interação e o resultado. Se moderação for sustentada, a 
estimativa correspondente, y,,, neste caso, seria signifi- 
cante. Note que os efeitos de É, e É, sobre m, são de vali- 
dade questionável na presença de uma interação signifi- 
cante. Portanto, eles devem ser estimados e interpretados 
somente no caso de o termo de interação estrutural (y,,) 
ser insignificante [15]. 

Por vezes, termos de interação causam problemas com 
convergência do modelo e distorção dos erros padrão [1]. 
Assim, amostras maiores são frequentemente exigidas 
para minimizar a distorção. Um tamanho amostral míni- 
mo absoluto seria de 300 para este tipo de análise, sendo 
amostras de 500 ou mais recomendadas. 


Ilustração HBAT de moderação. A ilustração HBAT 
pode ser empregada para exemplificar um teste de mode- 
ração com SEM. Aqui, uma variável categórica é teoriza- 
da como moderador. 


A HBAT suspeita também que homens e mulheres po- 


dem não exibir as mesmas relações em cada caso. Es- 
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0006 


Os valores abaixo seriam fixados como se segue: 
hos = Moka 089,1 = 710811 
x10,3 = Mo,2hx2,1 089,5 = 75035,5 
Nai,3 = Nah 0810,2 = 72 082,2 
Àaz3 = Ash 9310,6 = Te OB6,6 
hg1 = Than 0811,3 = 73 083,3 
x10,1 = Todya 1 081,7 = 770877 
Nat, = Tahyg1 03124 = 748344 
hz = Talhas 03128 = 78 088,8 
Àg2 = ToMys,2 
x10,2 = Tohyg,2 
hai, = Toda 
Axi2,2 = Tabyg,2 


FIGURA 12-11 Modelo usando um construto moderador de variável contínua. 


*Os rótulos restantes para as covariantes de erros foram omitidos do diagrama por simplificação. As cargas cruzadas ao longo dos construtos e as 
covariâncias de erros associadas com a natureza computacional do construto de interação são mostradas. 


(Continuação) 
pecificamente, eles estão interessados no papel teórico 


que atitudes com colegas podem desempenhar na cria- 
ção de satisfação com o trabalho. Com base em teoria, 
eles supuseram uma diferença nesta relação, sugerindo 
que a relação AC-JS seria maior entre mulheres, se com- 
parada com os homens. Assim, decidiram conduzir uma 
análise de múltiplos grupos usando a variável de classi- 
ficação de sexo. 


Muito do trabalho no exame desta hipótese é descrito 
no Capítulo 10. Lembre-se que comparações válidas de re- 
lações entre amostras requerem evidência de invariância 
métrica entre amostras. A CFA de múltiplos grupos esta- 
beleceu invariância métrica parcial. Ou seja, pelo menos 
duas cargas fatoriais por construto eram invariantes entre 
amostras (ver Capítulo 11). Invariância métrica parcial é 
suficiente para viabilizar comparações entre construtos. 


Seguindo os mesmos passos que foram usados para 
converter o modelo CFA de um grupo em um de dois 
grupos, um modelo estrutural de dois grupos foi configu- 
rado. O modelo estrutural TF estima o modelo estrutu- 
ral idêntico em ambos os grupos simultaneamente. Em 
seguida, um modelo é testado, o qual restringe a relação 
ACJS (y,5) a ser igual em cada amostra. 

Os resultados de ajuste para cada modelo são mos- 
trados na tabela a seguir: 


ACS5JS 
TF É igual AX 
x2 401,1 412,2 11,1 
df 360 361 1 
CFI 0,99 0,99 
RMSEA 0,024 0,027 
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O CFI não muda até duas casas decimais. A RMSEA 
é um pouco maior no modelo em que AC 5 JS (y,5) é 
igual nos grupos de homens e mulheres. Ax'= 11,2* com 
um grau de liberdade e é significante (p < 0,001). Dado 
o valor significante Ax”, a conclusão adequada é que res- 
tringir o parâmetro para ser igual entre os grupos produz 
ajuste pior. Logo, o modelo TF, no qual a relação AC > 
JS é livremente estimada em ambos os grupos, encontra 
respaldo. Este resultado sugere que sexo modera a rela- 
ção entre ACeJS. 

Olhando as estimativas paramétricas padronizadas 
para os resultados TF, o pesquisador da HBAT desco- 
bre que a relação AC > JS é significante em ambos os 
grupos. Como previsto, a relação é maior para mulhe- 
res, com uma estimativa completamente padronizada de 
0,24, enquanto a mesma estimativa é de —0,17 para ho- 
mens. Assim, parece que atitude com colegas de trabalho 
é positivamente relacionada com satisfação no emprego 
entre mulheres, mas negativamente relacionada entre 
homens. O resultado é um caso claro de moderação, no 
qual a natureza de uma relação (AC > JS, neste caso) 
muda conforme uma terceira variável (sexo). 


Assim, este exemplo demonstra como SEM pode ser 
usada para evidenciar moderação. Uma variável categóri- 
ca, como sexo, muda os parâmetros entre construtos. 


Análises multigrupo 


Análises multigrupo para modelos estruturais são uma ex- 
tensão do caso CFA de múltiplos grupos. O interesse agora 
se foca nas similaridades e diferenças entre parâmetros es- 
truturais que indicam distinções em relações entre os gru- 
pos. Frequentemente, pesquisadores desenvolvem uma teo- 
ria que prevê que uma ou mais relações estruturais variam 
entre grupos. Esta teoria tipicamente envolve um teste de 
moderação, como anteriormente descrito com o exemplo de 
moderação envolvendo grupos de homens e mulheres. SEM 
multigrupo é adequada nessas situações. Discutimos um 
exemplo envolvendo cruzamento de culturas nesta seção. 


A Figura 12-12 é uma ilustração de um modelo estrutural 
de múltiplos grupos. Considere que ele é testado usando 
dados obtidos de duas populações, cada uma de um país 
diferente. Motivos teóricos levam a expectativas de que al- 
gumas relações podem diferir entre países. O pesquisador 
pode acreditar que relações em um país não são tão fortes 
como em outro, por exemplo. Esta crença sugere um teste 
de moderação. Suponha que o pesquisador tivesse expec- 
tativas teóricas que levavam à previsão de que ambos os 
construtos A e B são mais fortemente relacionados com C 
no país 1 do que no país 2. Um modelo SEM de dois gru- 
pos poderia ser utilizado para testar esta expectativa. 


*N. de R. T.: O valor representado na Tabela é 11,7. Na realidade, 
ambos os valores 11,2 (no texto) e 11,7 (na tabela) estão incorretos. 
O valor seria, de fato, 11,1 (= 412,2 - 401,1). 


Lembre-se do Capítulo 11 que, antes que comparações 
válidas entre relações possam ser feitas, equivalência mé- 
trica deve ser estabelecida. Assumindo que um modelo 
CFA é testado, restringindo as cargas de mensuração a 
serem iguais em cada grupo, e que este modelo não apre- 
senta ajuste significativamente pior do que o modelo TF 
CFA, invariância métrica é sustentada. Assim como um 
modelo estrutural pode ser construído a partir de um mo- 
delo CFA na situação de um grupo, um modelo estrutural 
pode ser testado ao longo de ambos os grupos simulta- 
neamente. Primeiro, a mesma teoria pode ser avaliada 
para cada grupo, especificando padrões correspondentes 
de parâmetros estruturais livres e fixados em cada grupo. 
Segundo, pode ser testado um modelo que restringe essas 
relações específicas para serem iguais em cada grupo. 

Os ajustes do modelo podem ser comparados assim 
que ele seja estimado. Se o modelo que restringe as rela- 
ções para serem iguais se ajustar tão bem quanto aquele 
original que permite que cada seja livremente estima- 
do em cada grupo, então o resultado é consistente com 
estimativas paramétricas estruturais invariantes e, assim, 
inconsistente com a previsão. Se, contudo, o modelo com 
restrições de igualdade tiver ajuste significativamente 
pior (usando os critérios descritos no Capítulo 11), então 
permitir que os parâmetros tenham diferentes valores em 
cada grupo parece ser mais válido. Dada esta abordagem, 
se as estimativas de parâmetros forem maiores no grupo 
associado com o país 1, então a hipótese do pesquisador 
será sustentada. Perceba que pode também ser o caso de 
que apenas uma das estimativas paramétricas seria consis- 
tente com a previsão. 

Técnicas similares podem ser úteis na validação cru- 
zada de parâmetros estruturais ao longo de diferentes 
grupos ou no exame de diferenças baseadas em outras va- 
riáveis importantes de classificação cruzada. Além disso, 
moderação é testada por meio desta ferramenta. 


No exemplo anterior, a variável dicotômica de país é 
usada para separar os dados em grupos. As hipóteses 
implicam que ela modera as relações entre Ae Ce B 
e €. Na prática, este tipo de análise é útil e frequente- 
mente aplicado. Pesquisa organizacional frequentemen- 
te se concentra na maneira como diferentes fenômenos 
no ambiente de trabalho afetam homens e mulheres de 
forma distinta. Em algumas ocasiões, particularmente 
com variáveis relacionadas com stress, homens e mulhe- 
res reagem de forma muito diferente. Por exemplo, um 
modelo SEM de múltiplos grupos foi utilizado para de- 
monstrar como a relação entre conflito e desempenho é 
maior entre homens do que entre mulheres [4]. 


Dados longitudinais 


SEM tem sido cada vez mais aplicada em dados longitu- 
dinais. Dada a visão resultante de acompanhar mudanças 
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Amostra 1 


X; SR 


Qualquer relação estrutural pode ser 
modelada como a mesma em ambos 


adia lo cdcinintaa as ad os grupos. Elas seriam estabelecidas |... 


como sendo “Iguais” 


FIGURA 12-12 Ilustração de modelo estrutural de dois grupos. 


em construtos e relações ao longo do tempo, o crescen- 
te emprego de dados longitudinais pode ser benéfico em 
muitas áreas. Como muitos tipos diferentes de planeja- 
mentos de estudos longitudinais conduzem a muitas apli- 
cações distintas de SEM, esta seção oferece apenas uma 
breve introdução a algumas das diferenças fundamentais 
ao se lidar com dados longitudinais. O leitor interessado 
deve consultar outras fontes para uma discussão mais de- 
talhada [8]. 


Fontes adicionais de covariância: tempo 

Uma das questões importantes na modelagem de dados 
longitudinais com SEM envolve fontes adicionadas de 
covariância associadas com tomadas de medidas sobre 


Esta declaração no programa 
pode permitir um teste para 
saber se a relação entre Ce D 
é a mesma em cada grupo: 
EQIBENIRZNNBEIZI2! 


as mesmas unidades ao longo do tempo. Por exemplo, 
considere um modelo que suponha que habilidade de 
leitura provoca habilidade matemática. O argumento te- 
órico pode se basear no fato de que é necessário saber ler 
para estudar matemática adequadamente [14]. Suponha 
que dados longitudinais estejam disponíveis e que habili- 
dades em matemática e leitura sejam tratadas cada uma 
como construtos latentes medidos por indicadores múlti- 
plos. Habilidade matemática em qualquer dado instante 
(t) pode ser modelada como uma função de habilidade 
de leitura no instante (t), habilidade de leitura no ins- 
tante anterior (1-1) e habilidade matemática no instante 
anterior (1-1). A relação de uma habilidade significativa 
de leitura no instante (t-1) — habilidade matemática no 
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instante (t) ajudaria a fornecer evidência de causalidade, 
no sentido de que seria consistente com uma sequência 
temporal causal e estabeleceria covariância. É fácil per- 
ceber como o modelo poderia ser estendido para mais 
períodos de tempo. 

Uma questão estratégica é se é razoável esperar que 
as medidas indicadoras correspondentes em diferentes 
períodos de tempo sejam não-relacionadas. Em outras 
palavras, se velocidade de leitura é um indicador do cons- 
truto de habilidade de leitura em cada período de tempo, 
deveria ser modelada a correlação entre o teste indicador 
de velocidade de leitura no instante 1-1 e o teste indicador 
de velocidade de leitura no instante t? Falando em termos 
gerais, a resposta é positiva. 


Uso de covariâncias de erro para 

representar covariância adicionada 

Incluir um termo de covariância de erro de medição ou 
um construto adicional que é visto como uma outra cau- 
sa dos indicadores correspondentes representará a cova- 
riância adicionada. A Figura 12-13 fornece um diagrama 
de caminhos do tipo AMOS para o uso de parâmetros de 


Y, 4 


SÓ CENDOU 


Matemática , | 
(na) 


covariância de erro com o propósito de capturar a fonte 
extra de comunalidade. Cada caminho que deve ser esti- 
mado é indicado com uma seta. Note que setas curvadas 
de dois sentidos são agora mostradas a partir de cada ter- 
mo de erro de variável medida (0, ou 0,) para testes de 
correspondência. Colocando de outra forma, o primeiro 
teste de leitura (teste 1) é o mesmo aplicado em ambos os 
instantes t e t-1, de forma que o escore de um estudante 
em cada um deve ser correlacionado. O mesmo pode ser 
dito para cada um dos quatro testes em separado de ma- 
temática. Dessa maneira, pode ser feita uma tentativa de 
controlar as fontes adicionais de covariância que acompa- 
nham os dados longitudinais. Ainda que essas tentativas 
de controle se tornem complicadas rapidamente à medida 
que o número de construtos e de variáveis aumenta e ao 
longo de diferentes tipos de situações envolvendo dados 
longitudinais, tais modelos viabilizam um exame mais 
próximo de efeitos de tendências e podem ajudar a esta- 
belecer a condição de sequência temporal para causalida- 
de. Uma advertência final é que o número aumentado de 
parâmetros estimados pode, às vezes, levar a problemas 
com identificação estatística. 


Legenda da variável medida: 


Rótulo Escore no Instante 

X, =Teste 1 de leitura em t-1 

X> = Teste 2 de leitura em t—1 

X3 = Teste 3 de leitura em t-1 

X4, = Teste 4 de leitura em t—1 

Y, = Teste 1 de leitura em t 

Y> = Teste 2 de leitura em t 

Y3 = Teste 3 de leitura em t 

Y4 = Teste 4 de leitura em t 

Ys = Teste 1 de matemática em 1-1 
& | Ye =Teste 2 de matemática em t-2 
Y; = Teste 3 de matemática em t-3 
Ys = Teste 4 de matemática em t-4 
Y9 = Teste 1 de matemática em t 
Y40 = Teste 2 de matemática em t 
Y41 = Teste 3 de matemática em t 
Y4> = Teste 4 de matemática em t 


Matemática , 
(ma) 


1 


Y Y Y | | Y Y, 2 Y, Y, (o) Y 
4 4 
q» 


FIGURA 12-13 Modelo SEM usando termos de covariância fora da diagonal para modelar correlação de medidas correspondentes ao longo 


de diferentes períodos de tempo. 
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Outra forma na qual análises longitudinais são condu- 
zidas com modelos SEM é mediante o acompanhamento 
de mudanças em correlações ao longo de diferentes pe- 
ríodos de tempo. Imagine que um modelo SEM foi cole- 
tado para três diferentes períodos de tempo. Uma análise 
multigrupo pode ser conduzida sobre os três grupos para 
rastrear potenciais mudanças em médias ou relações de 
construtos. O processo evolui de maneira muito pareci- 
da com o procedimento multigrupo para moderação an- 
teriormente descrito. Por exemplo, um modelo que fixa 
uma relação em especial para que ela seja igual ao longo 
dos três períodos de tempo pode ser testado em compara- 
ção com um modelo que permita que a relação seja esti- 
mada nesses três períodos. Os ajustes para os dois mode- 
los podem ser comparados para ver se a relação é estável 
ao longo do tempo. 


Mínimos quadrados parciais 


Mínimos quadrados parciais (PLS) têm sido oferecidos 
como uma alternativa a SEM. PLS podem fornecer esti- 
mativas paramétricas para um sistema de equações linea- 
res, como a SEM faz. Mas eles se diferenciam em diversos 
aspectos importantes. Essas diferenças incluem as seguin- 
tes: 


e PLS tratam os fatores como escores compostos individuais. 
Em outros termos, eles não tentam recriar a covariância en- 
tre escores de itens medidos. 

e Graus de liberdade não desempenham um papel significati- 
vo em PLS, como acontece em SEM. 

* Em geral, PLS não se baseiam em procedimentos de otimi- 
zação, como ocorre com SEM. 

e Modelos de PLS apresentam menos problemas com identi- 
ficação estatística e com erros fatais que impedem soluções. 

e PLS encontram soluções baseadas na minimização da va- 
riância em construtos endógenos. SEM tenta reproduzir co- 
variância observada entre itens medidos. 

* PLS não podem distinguir indicadores formativos de refle- 
xivos. 

e PLS não exigem as características da boa medição para pro- 
duzir resultados. 

e PLS são menos sensíveis a considerações sobre tamanho 
amostral. 


Claramente, PLS apresentam vantagens e desvanta- 
gens em relação a SEM. As vantagens repousam principal- 
mente em sua robustez, o que significa que eles oferecem 
uma solução mesmo quando existem problemas que po- 
dem impedir uma solução em SEM. Os primeiros proble- 
mas são as dificuldades de medição. Por exemplo, quan- 
do um pesquisador se depara com um modelo estrutural 
com medidas de um só item ou uma mistura de diversas 
medidas de um ou dois itens, PLS podem ser um método 
alternativo que mais provavelmente fornecerá estimativas 
confiáveis das relações entre construtos do que acontece 
em SEM. Quando a validação de medidas de um e dois 
itens no contexto de uma teoria de mensuração tiver pou- 
co significado, PLS podem ser uma abordagem útil. 


O que um pesquisador deveria fazer se uma teoria de 
mensuração não consegue manter a investigação de uma 
CFA e o subseqiiente teste de validade convergente? PLS 
ainda oferecem estimativas de relações entre os constru- 
tos do modelo. Cabe ao pesquisador, em tais situações, 
qualificar os resultados com base na adequação das me- 
didas. Conforme aumenta a preocupação com qualidade 
de boa medida e as medidas de múltiplos itens se tornam 
disponíveis para construtos latentes, PLS não são reco- 
mendados como alternativa a SEM. 

As características de PLS os tornam muito diferentes 
da SEM em termos de metas. PLS estatisticamente pro- 
duzem estimativas paramétricas que maximizam variân- 
cia explicada de maneira muito parecida com regressão 
múltipla OLS. Logo, o foco é muito mais sobre previ- 
são. SEM, por outro lado, tenta reproduzir a covariação 
observada entre medidas, e esta tentativa permite uma 
avaliação de ajuste com base no quão bem elas são re- 
produzidas. Assim, podemos fazer uma asserção sobre 
o quão bem uma dada teoria, como representada por 
um modelo SEM, explica essas observações. Portanto, a 
SEM está mais preocupada com explicação [12] e é uma 
ferramenta mais adequada para teste de teoria. PLS tam- 
bém podem ser uma maneira útil de rapidamente explo- 
rar um grande número de variáveis para identificar con- 
juntos de variáveis (componentes principais) que podem 
prever alguma variável de resultado. Neste sentido, PLS 
têm algo em comum com análise canônica, mas alguns 
usuários podem achá-los mais fáceis de usar. 

Diversas versões de algoritmos PLS podem ser con- 
duzidas dentro de programas SEM, como LISREL [12]. 
Uma variação de PLS está também disponível no pacote 
estatístico SAS. Ela é fácil de utilizar, e tudo o que o pes- 
quisador precisa especificar é a variável pretendida de re- 
sultado, o conjunto de variáveis medidas que podem pre- 
vê-la, e o número de fatores que existem dentro daquele 
conjunto de itens. O pesquisador não tem que especificar 
um padrão fatorial como em SEM. 


A Figura 12-14 mostra uma saída PLS comentada. Este 
modelo em particular está tentando prever o custo de 
todos os itens comprados por um consumidor, com base 
nas emoções sentidas durante as compras. A variável de- 
pendente é um único item (custo). Os itens que compõem 
os fatores são rotulados de emotl a emot10. Neste caso, 
as perspectivas para explicar a variável dependente não 
são tão boas. Os dois componentes extraídos explicam 
menos do que 5% da variância na medida dependente. 
As cargas podem ser interpretadas exatamente como na 
discussão do Capítulo 3. A componente 1 tem sua carga 
mais alta para a variável emot5. A componente 2 apre- 
senta sua carga mais elevada para emot9. Isso deve ser 
útil para verificar o significado da componente. A parte 
final da saída mostra os coeficientes não-padronizados 
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(Continuação) 
de regressão. Neste caso, ambas as componentes pro- 
duzem estimativas paramétricas parecidas (0,10 e 0,08, 
respectivamente). Diferentes opções de saída podem ser 
especificadas para produzir outras estatísticas comuns de 
modelos. 


Conceitualmente e na prática, PLS são similares ao 
emprego de análise de regressão múltipla no exame de 
possíveis relações entre fatores compostos obtidos atra- 
vés de EFA. Em certos casos, particularmente quando as 
medidas são problemáticas, eles podem ser uma alternati- 
va a SEM. Não obstante, PLS não oferecem um teste tão 
completo quanto SEM. 


Confusão de interpretação 


Quando um modelo CFA é alterado para representar 
um modelo estrutural, por vezes as estimativas paramé- 
tricas que correspondem ao modelo de mensuração (es- 
pecialmente Ax e Ay) mudam. Quando isso acontece, 
elas indicam um problema com as medidas. Confusão de 
interpretação ocorre quando estimativas de cargas va- 
riam substancialmente de um modelo SEM para outro 
que é o mesmo, exceto pela mudança de especificação 
de uma ou poucas relações. Essa mudança significa di- 
ficuldade na classificação de qual item indicador mede 
um construto latente em particular [6]. Frequentemen- 
te, a confusão de interpretação resulta da instabilidade 


O sistema SAS 
O procedimento PLS 
Leitura de declarações: 
proc pls nfactors = 2 details; 
model cost = emotl-emot10; 


Variação percentual explicada por 
fatores de mínimos quadrados parciais 


Número de 
Efeitos de modelo 


fatores 

extraídos Corrente Total Corrente 
il 34,6523 34,6523 3,4163 
2 13, 7581 48,4105 0,9778 


Cargas de efeito de modelo 


Número de fatores 


associada com fatores sub-identificados. Ou seja, fatores 
com menos de três itens são tipicamente associados a 
este problema. 

Confusão de interpretação pode ser eliminada quan- 
do a validade do modelo de mensuração é avaliada sepa- 
radamente da validade do modelo estrutural. Se o pes- 
quisador observa mudanças substanciais em estimativas 
de cargas quando compara os resultados de mensuração 
com os estruturais, então confusão de interpretação é 
um problema provável e as medidas podem precisar de 
mais desenvolvimento ou refinamento. Além disso, o 
método de dois passos oferece uma avaliação única de 
validade de construto, testando a teoria de mensuração 
que especifica como itens medidos estão relacionados a 
construtos. 

CFA é o primeiro estágio no processo SEM de dois 
passos. O segundo passo é o teste do modelo teórico ou 
causal. No entanto, os dois passos não são independen- 
tes, pois os caminhos estimados que conectam os itens 
medidos aos construtos estão envolvidos no cálculo das 
estimativas dos caminhos estruturais. Ajuste é avaliado 
duas vezes, sendo que uma vez para o modelo de mensu- 
ração e outra para o estrutural. Um método alternativo 
é a execução de uma só análise, resultando em uma ava- 
liação de ajuste. No entanto, faltas de ajuste não podem 
ser atribuídas ao modelo de mensuração ou o estrutural. 
Além disso, se o modelo de mensuração é ruim, então os 
resultados estruturais não são confiáveis. Por essas razões, 
a abordagem de dois passos é preferível. 


O nfactors = 2 é uma especificação de usuário que 
diz ao programa PLS para formar dois fatores a 
partir do conjunto de variáveis listadas. O modelo 
especifica custo (cost) como uma variável 
dependente e as variáveis emot1-emot10 como o 
conjunto de preditores potenciais. 


Variáveis dependentes 


A saída básica. Os Efeitos de Modelo 
mostram o grau de variação explicada nas 
variáveis preditoras usando duas compo- 
nentes (48,4%). As colunas de variáveis 
3,4163 «df dependentes mostram variância explicada 
4,3941 na variável dependente usando essas 
componentes (4,39%). 


Total 


extraídos emot1 emot 2 emot 3 emot 4 emot 5 emot 6 emot 7 emot 8 emot 9 emot 10 
2 0,4100 —0,3284 0,3704 —0,2447 0,4273 —0,2661 0,4156 0,2854 0,0292 0,1352 
2 0,3166 0,1006 0,0136 0.5063 0,0664 0,4332 —0,1102 -—0,2822 0,5391 0,2414 


Pesos de efeito de modelo 


" Mostra cargas de componente 
principal para cada variável sobre 
cada componente. 


Número de Coeficientes 
fatores dentro de 
extraídos regressão 
0,0992911 
2 0,0843083 


Mostra as estimativas de regressão 
para cada componente. 


FIGURA 12-14 Análise PLS de SAS anotada. 
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Tópicos avançados 


e Efeitos indiretos que são pequenos (menores do que 

0,08) geralmente não despertam interesse, pois eles 

são provavelmente irrelevantes relativamente a efeitos 

diretos 

Moderação por uma variável de classificação pode ser 

testada com SEM de múltiplos grupos: 

* Uma SEM de múltiplos grupos primeiramente 
permite que todos os parâmetros teorizados sejam 
livremente estimados 
Em seguida, é estimado um segundo modelo, no 
qual as relações que são consideradas moderadas são 
restritas a serem iguais em todos os grupos 
Se o segundo modelo se ajusta tão bem quanto o 
primeiro, moderação não encontra sustentação 
Se seu ajuste for significativamente pior, então a 
moderação fica evidente 

O modelo de múltiplos grupos é conveniente para testar 

moderação: 

e Se uma variável moderadora contínua pode ser 
alterada em grupos de um modo que faça sentido, 
então grupos podem ser criados e os procedimentos 
anteriormente descritos podem ser empregados para 
testar moderação 
Este procedimento pode demandar a eliminação de 
um terço das respostas mais próximas da mediana, a 
fim de se criar dados bimodais (dois grupos lógicos) 
Análise de agrupamentos pode ser utilizada para 
a identificação de grupos para fins de comparação 
entre eles 
Dados unimodais não devem ser divididos em grupos 
com base em uma simples partição pela mediana 

Quando se usa uma variável contínua moderadora 

formada como uma interação de construto: 

e Asrelações diretas entre o construto preditor e o 
construto resultado e entre o construto moderador e 
o construto resultado devem ser estimadas somente 
se a relação entre a interação de construto e o 
resultado for insignificante 
Amostras maiores são necessárias para acomodar 
interações de variáveis contínuas (ou seja, N > 500) 

Equivalência métrica (pelo menos parcial) deve ser 

estabelecida antes que possam ser feitas comparações 

válidas de relações entre grupos 


Resumo 


Uma análise SEM completa envolve tanto o teste da teo- 
ria de mensuração quanto da teoria estrutural que conecta 
construtos entre si de uma maneira logicamente significa- 
tiva. Neste capítulo, aprendemos como completar a aná- 
lise estendendo nosso modelo CFA de um modo que per- 
mitiu um teste do modelo estrutural como um todo, o que 
inclui o conjunto de relações que mostram como os cons- 
trutos se relacionam. SEM não é apenas mais uma técnica 


estatística multivariada: é uma maneira de testar teorias. 
Ferramentas estatísticas muito mais fáceis e mais apro- 
priadas estão disponíveis para a exploração de relações. 
Mas quando um pesquisador conhece o suficiente sobre 
um assunto para especificar um conjunto de relações en- 
tre construtos, além da maneira como tais construtos são 
medidos, a SEM passa a ser um poderoso e adequado re- 
curso. Este capítulo destaca diversos pontos estratégicos 
associados a SEM, incluindo os seguintes: 


Distinguir um modelo de mensuração de um estrutu- 
ral. A principal diferença entre um modelo de mensu- 
ração e um estrutural é o modo como relações entre cons- 
trutos são tratadas. Em CFA, um modelo de mensuração 
é testado, o qual geralmente assume que cada construto 
se relaciona com outro. Nenhuma distinção é feita entre 
construtos exógenos e endógenos, e as relações são repre- 
sentadas como correlações simples com uma seta curva 
de dois sentidos. No modelo estrutural, construtos endó- 
genos são diferenciados dos exógenos. Os exógenos não 
têm setas chegando neles. Construtos endógenos são de- 
terminados por outros construtos no modelo, como visu- 
almente indicado pelo padrão de setas de um só sentido 
que apontam para construtos endógenos. 


Descrever as similaridades entre SEM e outras técnicas 
multivariadas. Apesar de CFA ter muito em comum 
com EFA, a parte estrutural da SEM é parecida com re- 
gressão múltipla. As diferenças importantes residem no 
fato de que o foco é geralmente em como os construtos 
se relacionam entre si, e não em como as variáveis fazem 
isso. É bastante provável também que um construto endó- 
geno seja usado como preditor de outro endógeno dentro 
do modelo SEM. 


Descrever um modelo teórico com relações de dependên- 
cia usando um diagrama de caminhos. O capítulo des- 
creveu procedimentos para converter um diagrama de ca- 
minhos de CFA em um diagrama estrutural de caminhos. 
Em um diagrama como este último, as relações entre 
construtos são representadas por setas de um só sentido. 
As abreviações comuns também mudam. Itens indicado- 
res medidos para construtos endógenos são geralmente 
chamados de y, enquanto os indicadores de construtos 
exógenos são denotados por x. 


Testar um modelo estrutural usando SEM. A configu- 
ração de CFA pode ser modificada e o modelo estrutural 
testado usando o mesmo programa SEM. Modelos são 
sustentados em um sentido mais amplo quando as estatís- 
ticas de ajuste sugerem que as covariâncias observadas são 
adequadamente reproduzidas pelo modelo. As mesmas 
diretrizes que se aplicam a modelos CFA funcionam para 
o ajuste do modelo estrutural. Além disso, quanto mais 
próximo o ajuste do modelo estrutural estiver do ajuste 
do modelo CFA, maior confiança o pesquisador pode ter 
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no modelo. Finalmente, o pesquisador deve também exa- 
minar a significância estatística e a direção das relações. 
O modelo é sustentado na medida em que as estimativas 
paramétricas são consistentes com as hipóteses que as re- 
presentaram antes do teste. 


Diagnosticar problemas com os resultados de SEM. A 
mesma informação diagnóstica pode ser utilizada tanto 
para ajuste do modelo estrutural quanto para ajuste do 
modelo CFA. A significância estatística de relações-chave 
(ou a falta dela), os resíduos padronizados e os índices de 
modificação podem todos ser usados na identificação de 
problemas com um modelo SEM. 


Entender o conceito de mediação e moderação estatísti- 
ca. Diversos tipos diferentes de relações são discutidos. 
Em particular, as noções de mediação e moderação são 
explicadas. Mediação envolve uma sequência de relações 
tal que algum construto intervém em uma sequência entre 
dois outros. Moderação envolve mudanças em relações 
baseadas na influência de uma terceira variável ou cons- 
truto. Moderação foi discutida no contexto de modelos 
SEM de múltiplos grupos e interações de variáveis con- 
tínuas. Sempre que possível, a abordagem multigrupo é 
recomendada. 


Questões 


1. De que maneira uma teoria de mensuração é diferente de 
uma estrutural? Quais implicações essas diferenças têm so- 
bre a maneira como um modelo SEM é testado? Como o 
diagrama visual de um modelo de mensuração se distingue 
daquele de um modelo SEM? 

2. Como uma variável medida representada com um único 
item pode ser incorporada em um modelo SEM? 

3. Qual é a característica marcante de um modelo SEM não- 
recursivo? 

4. Como é estimada a validade de um modelo SEM? 

5. Qual é a maior preocupação quando se usam técnicas SEM 
com dados longitudinais? 

6. O que são PLS e como se diferenciam de SEM? 

7. Esboce um modelo estrutural supondo que três construtos 

exógenos, X, Y e Z, afetam, cada um, o construto mediador 

M, que, por sua vez, determina outros dois resultados Pe R. 

Como SEM pode testar um efeito moderador? 

Por que é importante examinar os resultados de um modelo 

de mensuração antes de se prosseguir com o teste do mode- 

lo estrutural? 


O 90 


Leituras sugeridas 


Uma lista de leituras sugeridas que ilustra problemas e 
aplicações de técnicas multivariadas em geral está dispo- 
nível na Web em www.prenhall.com/hair (em inglês). 


Apêndice 12A 


As relações multivariadas em SEM 


Diversos grupos de equações multivariadas estão envol- 
vidos na estimativa de um modelo estrutural. Não se diz 
modelagem de “equações” estruturais por acaso! Ainda 
que seja possível aprender como executar um modelo 
SEM sem uma compreensão completa sobre suas equa- 
ções, conhecer o básico pode ser útil no entendimento 
da distinção entre variáveis medidas e construtos e entre 
construtos exógenos e endógenos. Além disso, as equa- 
ções ajudam também a mostrar como a SEM é parecida 
com outras técnicas. 


A principal equação estrutural 


As equações que explicam as variáveis medidas (x e y) do 
Capítulo 11 são necessárias em SEM. Elas são essenciais 
porque são, em última instância, as equações que forne- 
cem os valores previstos das variáveis medidas. Em re- 
gressão, nossa meta era construir um modelo que previsse 
uma única variável dependente. Aqui, estamos tentando 
prever e explicar um conjunto de construtos endógenos. 
Portanto, precisamos de equações que expliquem cons- 
trutos endógenos (mn) além daquelas que explicam os itens 
medidos. Sem surpresa, percebemos que essas equações 
são semelhantes à equação de regressão múltipla que ex- 
plica a variável dependente (y) com múltiplas variáveis 
independentes (ou seja, x, e x,*). Esta equação estrutural 
chave pode ser expressa como (consulte o guia de abre- 
viações no Apêndice 10B para qualquer ajuda necessária 
com pronúncias ou definições): 


n=Bn+VE+i 


O m representa os construtos endógenos em um mode- 
lo. A Figura 12-2 mostra dois construtos endógenos: Gas- 
tos e Comprometimento de cliente. Esses valores serão 
previstos pelo modelo. O m aparece em ambos os lados 
da equação porque construtos endógenos podem ser de- 
pendentes uns dos outros*. Na figura, comprometimento 
de clientes (m,) é dependente de gastos de clientes (nm); 
logo, resultará uma estimativa paramétrica que sugere 
como eles se relacionam. O B representa os coeficientes 


* Este cálculo é possível graças à álgebra linear envolvida na compu- 
tação. O resultado final é que um m pode ser uma função de outros. 
Por exemplo, uma representação escalar da equação de regressão 
para m, pode aparecer como: 


m=Bn,+e 
* N. de R. T.: Na realidade, múltiplas variáveis independentes seriam 


denotadas mais adequadamente por X,, X,, ..., X, . 


paramétricos que conectam construtos endógenos com 
outros construtos endógenos. O B é uma matriz que con- 
siste de tantas linhas e colunas quanto o número de cons- 
trutos endógenos. Assim, para o modelo da Figura 12-2, 
B seria uma matriz 2 x 2, com duas linhas e duas colunas. 
Os elementos individuais de B são designados por um B, 
como mostrado na figura. O T' é a matriz correspondente 
de coeficientes paramétricos que conectam os construtos 
exógenos (m) com os endógenos (m). É igualmente uma 
matriz que apresenta tantas linhas quanto o número de 
construtos exógenos e tantas colunas quanto a quantia de 
construtos endógenos. O modelo da Figura 12-2 produz 
uma matriz (1) 3 x 2. Seus elementos individuais são de- 
signados por y, como mostrado na figura. Finalmente, ú 
representa o erro na previsão de m. Ele pode ser consi- 
derado como o recíproco do conceito de R” em regressão 
(ou seja, 1— R). 

Outra maneira de pensar na equação estrutural é como 
uma equação de regressão múltipla que prevê n (um cons- 
truto) ao invés de y, com os outros valores m e E como pre- 
ditores. B (B,,,...) e T (y,,...) fornecem estimativas de 
parâmetros estruturais. Na equação de regressão, os valo- 
res preditores foram representados por x, e as estimativas 
paramétricas padronizadas, por B. Em ambos os casos, a 
estimativa paramétrica descreve a relação linear entre um 
preditor e um resultado final. Assim, existem claras seme- 
lhanças entre SEM e análise de regressão. 


Uso de estimativas paramétricas 
para explicar construtos 


Podemos mostrar como qualquer construto em particu- 
lar seria representado pela substituição de valores em tal 
equação. Você pode recordar nossa discussão sobre como 
valores para Y podem ser obtidos a partir de resultados 
de regressão (Capítulo 4). Seguindo esses mesmos pro- 
cedimentos, pode ser obtida uma equação para gastos de 
cliente (m,) na Figura 12-2: 


M= a + eo + Nat g 


Analogamente, uma previsão de comprometimento de 
cliente (m,) pode ser representada como uma função de 
gastos de clientes (m,), a qual é uma função dos três cons- 
trutos exógenos mostrados (Preço, &,; Serviço, &: Atmos- 
fera, E;), exibida a seguir, com base na Figura 12-2: 


m=Bn ti, 
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A suposição é de que o valor esperado dos termos de 
erro (6, e £,) é 0, podendo assim ser descartados no cálcu- 
lo de valores previstos. 


Uso de construtos para explicar 
variáveis medidas 


Uma vez que são conhecidos valores para m, podemos tam- 
bém prever as variáveis y usando uma equação da forma: 


pé E Amy a E, 


Novamente, o valor esperado de e, é 0. Valores previs- 
tos para cada y (y, — y,) podem ser computados de manei- 
ra análoga. Valores previstos para cada x também podem 
ser computados da mesma maneira usando-se a seguinte 
equação: 


4 = A, 18 +8, 


Os valores previstos para cada variável observada 
(seja um x previsto ou um y) podem ser usados para 
calcular estimativas de covariância que podem ser com- 
paradas com os termos reais de covariância observada 
na avaliação do ajuste do modelo. Em outras palavras, 
podemos usar as estimativas paramétricas para modelar 
as verdadeiras variáveis observadas. A matriz de cova- 
riância obtida pela computação de covariação entre valo- 
res previstos para os itens medidos é >,. Lembre-se que 
a diferença entre a matriz real de covariância para itens 
observados (S) e a matriz de covariância estimada é uma 
parte importante da análise de validade de qualquer mo- 
delo SEM. 

Na maioria das aplicações, raramente é necessário listar 
valores previstos com base nos valores de outras variáveis 
ou construtos. A despeito de ser útil compreender como 
valores previstos podem ser obtidos, pelo fato de que isso 
ajuda a demonstrar o modo como SEM funciona, o foco em 
ciências sociais geralmente é sobre a explicação de relações. 


Apêndice 12B 


Como fixar cargas fatoriais para um valor 
específico em LISREL 


Se um pesquisador desejasse fixar as cargas fatoriais de 
um modelo SEM para os valores identificados na CFA, 
procedimentos como os que aqui estão descritos pode- 
riam ser usados. Voltando à Figura 12-5, o pesquisador 


FI LX 11 1X211LX311X411X52 
FILY11ILY211LY31LY7411Y52 
VA 0,80 LX 
VA 0,70 LX 
VA 0,80 LX 
VA 0,75 LX 
VA 0,90 LX 
VA 0,80 LX 
VA 0,75 LX 
VA 0,70 LX 
VA 0,70 LY 
VA 0,90 LY 
VA 0,75 LY 
VA 0,75 LY 
VA 0,85 LY 
VA 0,80 LY 
VA 0,80 LY 
VA 0,70 LY 


o IA UE WUNHO Ow wmnNH 
to to to torno RtotovtllvkEnR--= 


seguiria os seguintes passos, no caso de estar utilizando o 
programa LISREL. 

As estimativas de cargas a seguir seriam fixadas e seus 
valores seriam atribuídos da seguinte maneira: 


IX 6 2 
LY 6 2 


LX 72 1X82 
LyY 721782 


Os termos de variância de erro também podem ser fixados em suas estimativas CFA como se mostra a seguir: 


a 


FI ID 4 2 ID33 TD4 4 TD5S 


E 


ND MN 


FI TE 1 1 

VA 0,36 TD 
VA 0,51 TD 
VA 0,36 TD 
VA 0,44 TD 
VA 0,19 TD 
VA 0,36 TD 
VA 0,44 TD 
VA 0,36 TD 
VA 0,51 TE 
VA 0,81 TE 
VA 0,44 TE 
VA 0,44 TE 
VA 0,28 TE 
VA 0,36 TE 
VA 0,36 TE 
VA 0,51 TE 


TE 33 TE4 4 TESS 


oINUWMEAWUúNHCOSJAUWUEwUnNHA O 
oIAUWMEWNHOSOAUWEWNHAOMN 


O pesquisador poderia então prosseguir para especificar os elementos livres da teoria estrutural. 


Apéndice 120 


Mudança de uma configuração CFA em LISREL 
para um teste de modelo estrutural 


Um modelo estrutural deve ser comunicado ao programa 
SEM antes que os resultados possam ser obtidos. Diferen- 
tes programas oferecem diferentes opções para este pro- 
cesso. Listam-se aqui exemplos de mudanças na sintaxe 


Comandos de modelo de mensuração: 


MO NX = 16 NK = 4 PH = SY,FR < 


de LISREL que correspondem à Figura 12-3. As linhas 
que não são exibidas aqui (DA, SE, OU etc.) não têm que 
ser modificadas. 


Isto especifica quatro construtos 


VA 1.0 LX 1 1 LX521X931LXI3A4 
FR LX 2 1 1X311X411X621X721IXS8A 
FR LX 10 3 LX 11 3 LX 12 3 LX 14 4 LX 15 4 IX 16 4 


Comandos de modelo estrutural: 


com 16 variáveis medidas. Não 
são separados em construtos 
endógenos e exógenos. 


MO NY = 8 NE = 2 NX = 8 NK = 2 PH = SY,FR PS = DI,FR GA = FU,FI BE = FU,FI 


VA 1.0 LX111X521LY111Y52 

FR LX 2 1 1X311X411X621X721IXS8A 
FR LY 21 1731174117 621L7721Y782 
FR GA 1 1 GA12 

FR BE 2 1 


Essas linhas ilustram as mudanças necessárias para o 
comando do modelo e para os padrões de matriz de pa- 
râmetros para converter o modelo CFA em um modelo 
estrutural. Os comandos CFA são familiares, dadas as 
configurações descritas no capítulo anterior. A configura- 
ção do modelo estrutural mostrada na metade de baixo da 
Figura 12-3 tem diversas modificações: 


1. O comando MO agora fornece valores para: 

a. O número de indicadores de construtos endógenos (NY 
=8) 

b. O número de construtos endógenos (NE =2) 

c. O novo número de indicadores de construtos exógenos 
(NX=8) 

d. O novo número de construtos exógenos (NK =2) 

2. O comando MO agora fornece as matrizes paramétricas 
para as estimativas de parâmetros estruturais: 

a. GA se refere às relações entre construtos exógenos e 
endógenos (T, ou gama do Capítulo 10). É especificada 
como completa (FU) e fixada (FI). A convenção é espe- 
cificar elementos livres individuais embaixo. 

b. BE se refere às relações entre construtos endógenos (p, 
beta do Capítulo 10). Também é especificada como FU 


Esta linha especifica dois construtos endógenos 
e dois exógenos. As variáveis medidas são ago- 
ra distinguidas como x ou y, respectivamente. 


e FI. Os elementos livres serão especificados com um 
comando FR abaixo da linha MO. 
3. As escalas são fixadas para os construtos exógenos e endó- 
genos fazendo uma carga igual a 1,0, como se segue: 


VA 1.0 1X 11 1X5 21LY7111LY752 


4. O padrão fatorial para A e A, (as respectivas matrizes de 
cargas) é especificado de maneira muito parecida como se 
faz no modelo CFA. A única diferença é que os indicadores 
de itens para os construtos C e D são agora chamados de 
LY, ao invés de LX. 

5. O padrão de hipóteses entre construtos latentes é represen- 
tado liberando-se os elementos apropriados de T e B, res- 
pectivamente. 

a. FRGA11GAI12Z 
b. FRBE21 


O restante da sintaxe do modelo pode ser especifica- 
do como na configuração do modelo CFA, com a exceção 
dos comandos opcionais de rótulo (LA). Comandos sepa- 
rados de rótulos são necessários para construtos exógenos 
e endógenos. Tais linhas começam com LK e LE, respec- 
tivamente. 


Apêndice 12D 


Sintaxe do programa SEM do exemplo 
HBAT para LISREL 


A sintaxe do programa LISREL pode ser desenvolvida a 
partir da CFA da HBAT. Uma configuração que repre- 
senta a SEM da HBAT é mostrada aqui. Foram acrescen- 


01 TI MODELO DE RETENÇÃO DE EMPREGADOS DA HBAT 
02 DA NI = 28 NO = 399 NG = 1 MA = CM 

03 CM FI = HBAT.COV 

04 LA 


tados números à esquerda das linhas para ajudar a descre- 
ver a sintaxe. 


05 ID JSi OC1 OC2 EP1 OC3 OC4 EP2 EP3 AC1 EP4 JS2 JS3 AC2 SI1 JS4 SI2 JS5 AC3 SI3 AC4 SI4 


06 Ci C2 C3 AGE EXP JP 
07 SE 


08 JS1 JS2 JS3 JS4 JS5 OC1 OC2 OC3 OC4 SI1 SI2 SI3 SI4 EP1 EP2 EP3 EP4 AC1 AC2 AC3 AC4/ 


09 MO NY = 13 NE 3 NX = 8 NK = 2 PH 


10 VA 1.00 LX 1 1 LX5 21LY11LY62LY1og3s 
11 FR IX 2 1 LX3 1 LX 4 1 LX6 2 1LX721X82 
12 FRILY 2 1LY31LY741LY51LY7 

13 FRGA1 1GA21GAÃ1i2GA2Ml 

14 FR BE 2 1 BE3 1BE32 

15 LK 

16 EP AC 

17 LE 

18 US OC SI 

19 PD 


20 OU RS SCMI EF ND =2 


As mudanças aqui correspondem àquelas descritas 
anteriormente no capítulo. A primeira mudança na con- 
figuração CFA é observada na linha 09. O comando do 
modelo deve agora especificar um número de variáveis e 
construtos para o caso de construtos exógenos e endóge- 
nos. Assim, a linha MO especifica NY = 13 (5 itens para 
JS, 4 itens para OC, 4 itens para SI). Ainda que esses se- 
jam os mesmos itens representados por tais construtos no 
modelo CFA, eles agora se tornam variáveis y, pois eles 
são associados com um construto endógeno. Seus pará- 
metros de carga são agora modificados para à, (LY) para 
serem consistentes com isso. A seguir, a linha MO espe- 
cifica NE = 3, indicando três construtos endógenos. Este 
processo é repetido para os construtos exógenos (NX = 8 
e NK =2). PHe TD permanecem os mesmos. 

Diversas novas matrizes são especificadas. BE = FU,FI 
significa que B, que lista todos os parâmetros que conec- 
tam construtos endógenos com outro (B), é marcado 
como completa e fixada. Isso significa que liberamos os 
elementos correspondentes às hipóteses seguintes. GA 
representando TI, que lista todos os parâmetros que co- 
nectam construtos exógenos com endógenos (y), é tratada 
da mesma maneira. Como temos agora construtos endó- 
genos, os termos de variância de erro associados com as 


SY,FR PS = DI,FR BE = FU,FI GA = FU,FI TD = DI,FR TE = DI,FR 


2 .LY 8 2 LY 9 2 LY 11 3 EY 12 3. LY 13 3 


13 variáveis y são agora mostrados em 0, que é abreviado 
por TE = DLFR, o que corresponde a dizer que se trata 
de uma matriz diagonal e que os elementos da diagonal 
serão estimados. 

A linha 10 fixa a escala para fatores, assim como no 
modelo CFA, com a exceção de que três dos valores fi- 
xados são para variáveis y (valores À: LY 1,1; LY 6,2; 
LY 10, 3). As linhas 11 e 12 especificam os valores livres 
para os itens medidos, como na CFA. Estamos seguindo 
a regra prática de que os parâmetros de carga fatorial li- 
vres devem ser estimados ao invés de fixados, mesmo que 
tenhamos alguma idéia sobre seus valores com base nos 
resultados de CFA. As linhas 13 e 14 especificam o padrão 
de parâmetros estruturais livres. A linha 13 especifica os 
elementos livres de T. Estes correspondem a H, — H, na 
Figura 12-6 (y,, se lista como GA 1, 1). Analogamente, a 
linha 14 especifica os elementos livres de B. As linhas 15 
e 16 listam os rótulos para os construtos é (LK). As linhas 
17 e 18 fazem o mesmo para os construtos m (LE). A linha 
19 contém um PD que diz ao programa para gerar um dia- 
grama de caminhos a partir da entrada. A linha 20 é a de 
saída e é a mesma do exemplo CFA, exceto pela adição de 
EF, o que fornece uma lista separada de todos os efeitos 
diretos e indiretos. 
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Se o usuário está empregando uma interface gráfica 
(p. ex., AMOS ou LISREL), ele precisará fazer as mo- 
dificações correspondentes no diagrama de caminhos. 
Essas modificações incluem a garantia de que os constru- 
tos estão apropriadamente designados como exógenos 
ou endógenos e que cada variável observada apresenta 
um respectivo termo de variância de erro. Em seguida, 
cada uma das setas curvas de dois sentidos que designa 
covariância entre construtos na CFA deverá ser substi- 
tuída por uma seta de um sentido para representar rela- 
ções teorizadas. Setas entre construtos para os quais ne- 
nhuma relação é teorizada são desnecessárias. Logo, os 
caminhos de dois sentidos entre tais construtos na CFA 
podem ser eliminados. Uma vez que essas mudanças 


são promovidas, o usuário pode reestimar o modelo, e 
os resultados agora devem refletir o produto do modelo 
estrutural. Se a sintaxe do programa mudar como indica- 
do, o software produzirá automaticamente o diagrama 
de caminhos adequado. 

Um diagrama visual correspondente à SEM pode ser 
obtido selecionando-se Structural Model (Modelo Estru- 
tural) a partir das opções de visualização e solicitando-se 
que as estimativas completamente padronizadas sejam 
mostradas pelo programa SEM. Em LISREL, por exem- 
plo, os valores no diagrama de caminhos podem ser requi- 
sitados de forma que as estimativas são exibidas sobre o 
diagrama, ou os valores-t para cada estimativa, ou outras 
estimativas importantes, como os índices de modificação. 
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exemplo de, 58-59 
extensão de, 60-62, 69-70, 72 
impacto de, 56-59 
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593, 615-616 


formas de, 126-127 
nomológica, 126-127, 587-589, 592-593, 
615, 617-619 
Valor crítico, 304-308 
Valor de verossimilhança, 222-224, 287- 
288 
Valor logit, 286-287 
Valores de substituição, atribuição por, 
65-69 
Valores F (ou t) parciais 
análise discriminante, 248, 300-301 
definição de, 150-153 
em análise de regressão múltipla, 150- 
153, 179, 200-203 
Variância compartilhada, 193-195 
Variância comum, 100-102, 110, 112 
Variância de erro, 100-102, 110, 112 
Variância específica, 100-102, 110, 112 
Variância extraída (VE), 587-589, 591- 
592 
Variância única (específica), 100-102, 110, 
112 
Variáveis 


eliminações baseadas em dados perdidos, 


62-63 
em análise discriminante, 226-233, 246- 
247,251-252,264-266 
em análise fatorial, 106-108 
variância de, 110, 112 
Variáveis categóricas (não-métricas), 108, 
222-224 
Variáveis dependentes 
definições de, 21-22, 149-150, 152, 154 
em análise de regressão múltipla, 149- 
154, 165-166 
em análise discriminante/regressão 
logística, 222-224, 233-236 
em MANOVA, 328-330, 332-334 
em regressão logística, 283-285 
previsão com, 154-156 
Variáveis dicotômicas 
codificação de efeitos, 50-51, 96-97, 
100-102, 170-171 
codificação indicadora, 50-51, 92, 96-97, 
150-152, 154, 169-170 
construção de, 92, 96-97 
definições de, 21-22, 50-51, 100-102, 
149-150, 152, 154 
em análise de regressão múltipla, 149- 
150, 152, 154, 169-171,215-217 
em análise fatorial, 100-102, 108 
em regressão logística, 291-292 


Variáveis independentes 
cálculo de variância única e 
compartilhada, 193-195 
definições de, 21-22, 150-152, 154 
em análise de regressão múltipla, 150- 
154, 165-167 
em análise de regressão simples, 155- 
160 
em análise discriminante/regressão 
logística, 222-224, 235-236 
previsão sem, 154-156 
Variáveis independentes métricas, 84-85 
Variáveis independentes não-métricas, 
84-85. Ver também Variáveis dicotômicas 
Variáveis manifestas (medidas), 539-544 
Variáveis medidas, 539-544 
Variáveis métricas, 108, 222-224,234-236 
Variáveis não-métricas, 108, 222-224 
Variáveis substitutas, 100-102, 124-125, 
128, 137, 139-140 
Variável critério (Y). Ver Variáveis 
dependentes 
Variável estatística 
ausência em escalonamento 
multidimensional, 488-490 
definições de, 22-24, 50-51, 102, 222-224, 
304-306, 539-544 
em análise conjunta, 357-360, 366, 416- 
417 
em análise de agrupamentos, 427-430, 
436-438, 459-460, 468-469 
em análise de regressão múltipla, 173- 
175, 206-211 
em análise discriminante, 224-225 
em análise fatorial, 106 
em modelagem de equações estruturais, 
539-545 
Variável estatística conjunta, 357-360, 366 
Variável estatística de agrupamento, 427- 
430, 436-438 
Variável estatística de regressão, 150-154, 
188-195 
Variável preditora (X,). Ver Variáveis 
independentes 
VARIMAX, 102, 117-120, 133-136 
VE (Variância extraída), 587-589, 591-592 
Vetor, 222-224, 249-250, 482-485, 502-503 
Vetor expandido, 222-224, 249-250 
Viés de método constante, 587-589, 
633-634 
VIF (fator de inflação de variância), 151, 
153-154, 190-193, 201 


